"В этой статье речь пойдет о решении одной очень старой проблемы. Разработчики много лет бились над задачей быстрой доставки информации заинтересованным читателям и её ретрансляции во всевозможных клиентах. Поиск одновременно простого, функционального и унифицированного решения шел несколько лет. Что только за это время не появилось — от глобальной концепции Semantic Web до многочисленных прикладных решений и технологий. Так были разработаны Channel Definition Format (CDF) от Microsoft, PointCast, поддерживавшийся Netscape, Marimba Castanet и многие другие. Практически все решения так и сгинули в безвестности, и даже среди специалистов лишь единицы сейчас вспомнят хотя бы название этих технологий.
Из множества конкурирующих стандартов до наших дней благополучно дожили лишь 2: RSS и Atom. При этом RSS является действительно «народным» форматом, практически синонимичным для многих самому понятию синдикация. И RSS, и Atom – это основанные на XML форматы, предназначенные для сбора информации, т.е. аггрегирования. Эти стандарты, как, впрочем, и все, основанные на XML, реализуют давнюю идею разделения оформления и содержания и лишены одного из главных недостатков HTML — запутанности и перегруженности служебными и «оформительскими» элементами, которые крайне затрудняют автоматическое унифицированное получение и обработку информации: в данном случае транслируется только полезное содержание без каких-либо элементов дизайна, навигации и т.д.
RSS – это семейство стандартов формирования XML-документа, в который сохраняется информация об обновлениях. В подавляющем большинстве случаев речь идет об обновлении в новостной ленте, но, в принципе, это могут быть любые изменения. Впрочем, об этом мы поговорим чуть позже. Взаимоотношения между отдельными версиями этого формата достаточно запутаны. Представители этого семейства частично несовместимы друг с другом, но для конечного пользователя это практически не имеет значение — любая современная программа для работы с RSS понимает все его версии.
Atom — это также основанный на XML формат, предназначенный для аггрегирования информации об обновлениях, в первую очередь с веб-сайтов.
Как же это работает?
XML-файл, называемый фидом (от англ. feed – питание) или потоком, обновляется в тот же момент, когда появляется новая информация. При этом в фид записываются заголовок, описание и дата изменения (набор полей может варьироваться в зависимости от используемого стандарта и задачи, это лишь основные). Затем специальная программа или сервис, с заданной периодичностью проверяющие содержание этого потока, показывают пользователю, что же изменилось.
Информация об обновлении может использоваться как угодно – пользователь может прочесть эти данные на персонализированной «домашней странице» или в своем любимом аггрегаторе, будь то онлайновый сервис (скажем, BlogLines или Яндекс.Лента), на настольном компьютере (например, с помощью NewsGator или популярного открытого RSS Bandit) или на КПК (PocketRSS, PocketFeed и т.д.).
В качестве клиента для RSS-потока может выступать не только программа-аггрегатор конечного пользователя, но и специальный сервис, занимающийся публикацией информации на сайте. Если вы хотите разместить у себя на странице, скажем, последние новости, курсы валют или сводки погоды, то RSS может оказаться самым подходящим решением, гораздо более мощным и гибким, чем традиционные и давно привычные информеры. Для разработчиков особенно ценным может оказаться то, что информацию, полученную через фид, можно обработать как угодно и вывести именно в том виде, как это вам необходимо. Посмотрите, например, на сайт FeedBurner.com: одна из его задач – показ RSS фидов в удобном для конечного пользователя виде, так, чтобы RSS было легко прочесть без каких-либо дополнительных ухищрений непосредственно в браузере.
Оценить возможности автоматического сбора, анализа и публикации фидов можно на примере новостных порталов, агрегирующих данные с сотен и тысяч сайтов. Самые яркие примеры – Google News (четыре с половиной тысячи источников) и Яндекс Новости (http://news.yandex.ru/, почти 1400 источников).
источник http://www.celer.spb.ru/wiki/IzKomp'juterry/SindikacijaIAggregacija
А можно в двух словах? И более простыми словами??? Плз...
У меня Лорелея на XML-старндарте работает, и кажется клиент-банк тоже. А еще оно есть в Опере.
Так чем же Rss лучше чем HTML? Меньше объема занимает?
Rss и Html - это абсолютно разные категории. RSS - это система правил создания файла в формате XML, говоря упрощённо. То же самое и Atom. Скажем так: RSS/Atom берёт код в HTML, вынимает из него заголовок новости, её описание, ссылку на новость, формирует всё это в файл формата XML и выдаёт на выход, откуда его забирает Ваша программа (та же лорелея, например, или Опера, или любая другая подобная ей).
"Эти стандарты, как, впрочем, и все, основанные на XML, реализуют давнюю идею разделения оформления и содержания и лишены одного из главных недостатков HTML — запутанности и перегруженности служебными и «оформительскими» элементами, которые крайне затрудняют автоматическое унифицированное получение и обработку информации: в данном случае транслируется только полезное содержание без каких-либо элементов дизайна, навигации и т.д."
То есть формат XML не содержит в себе ничего лишнего, абсолютно, в нём нет никаких оформительских элементов. Ваша программа периодически (раз в минуту, раз в пять минут, раз в полчаса и т.д., зависит от настроек) обращается к серверу liveinternet.ru, например, и получает от него файл в формате XML, в котором находятся все обновления вашей френдленты и ленты комментариев во всех темах, на которые Вы подписаны. И показывает Вам всё новое, что поступило в промежутке времени между новым и старым её запросом. Этот файл на выходе обновляется каждый раз, когда появляется новый комментарий или сообщение. После того, как Вы его забрали, система делает у себя отметку и в следующем файле уже не показывает старые сообщения, а добавляет новые. Этот файл опять ждёт на выходе, когда за ним придут, постоянно обновляясь.
Как-то так, если упрощённо. Есть там много чего ещё, что касается способов обработки и вывода информации пользователю, но не будем усложнять. Если на пальцах: на сервере стоит программа, которая занимается формированием файла с новостями, а у Вас - программа, которая забирает информацию и показывает её Вам, без необходимости вашего личного присутствия на сервере :)