Мониторинг новостей. Работа с RSS лентой

Мониторинг новостей. Работа с RSS лентой

Что такое RSS?

RSS – это формат представления данных, как правило, он используется для формирования новостных лент на сайтах различных СМИ, но не только. Отдаются в подобном формате и последние темы форумов и посты в блогах.

Для менеджера по контенту работать с RSS может быть очень удобно, поскольку получать информацию можно практически мгновенно после ее публикации на сайте. Нет необходимости ходить на сайты, выискивать эту информацию и главное – все новости, все анонсы, все столь интересные данные сохраняются на компьютер самого менеджера, и работать с ними можно даже при отключенном Интернете в любое удобное время.

Как это происходит? На некоторых сайтах программно предусмотрена функция получения так называемого rss-фида, который и формируется новостями или анонсами форумных тем или топиков блога. Контент менеджер может элементарно скопировать url данного фида и вставить в свою rss-читалку, которых существует многое множество и даже Яндекс предоставляет такую возможность – читать выбранные rss-фиды. Но мы говорим об отдельных rss-агрегаторах, программах-клиентах для чтения и работы с rss-лентами.

Подобная программа устанавливается на компьютер пользователя. Пользователь – наш контент-менеджер – добавляет в нее те фиды, которые он хотел бы мониторить. Далее, с некоторой периодичностью наш rss-клиент запрашивает данные с выбранных фидов и уведомляет всплывающим окном о получении свежих новостей и анонсов. Таким образом, менеджеру не приходится бегать по разным сайтам регулярно в течение дня, чтобы убедиться, что никаких свежих новостей на них не разместили. Как только новость будет размещена – пользователь практически сразу получит уведомление об этом в своем rss-агрегаторе и сможет ознакомиться с заголовком и анонсом, ну и, конечно, в случае, если новость интересная – прочитать ее полностью там же, внутри программы и перейти на сайт за дополнительной информацией.

Вот такая полезная штука rss. Единственная проблема – отсталость наших, российских, владельцев информационных ресурсов. Считанные единицы используют подобную замечательную технологию на своих сайтах, а, между прочим, зря. Ведь rss добавленная в специальный сервис Яндекса – дает приличные шансы на дополнительную посещаемость. Особенно это касается блогов и форумов.

Но вернемся к работе менеджера по контенту. Основное направление в работе с rss уже понятно – конечно, это мониторинг и перевод новостей с зарубежных сайтов, ведь там данная технология распространена повсеместно и практически на каждом сайте вы где-нибудь на видном месте увидите оранжевый значек rss или слова «rss, feed, xml» – при клике на них вы перейдете на страницу rss – адрес которой можно скопировать в ваш rss-клиент.

Но есть и более интересная возможность для контент-менеджера в работе с rss – работа с поисковыми системами. Яндекс и Google не только имеют свой поиск по блогам и форумам, у них есть сервис новостей и, конечно, сам поиск. Задав необходимые запросы – мы можем мониторить новости на заданную тему. Соответственно, речь идет не только о зарубежных новостях, но и о наших – русскоязычных.

Работа с RSS лентой для мониторинга новостей

Для работы с rss мы выбрали две программы. Выбрали практически случайным образом, возможно, есть и лучше – но мы будем говорить именно об этих.

Обе программы – free software, что также немаловажно. Первая – Feedreader – подходит для пользователей Windows 2000/2003/Vista/XP и Liferea для пользователей Linux. Интерфейсы программ достаточно схожи, поэтому мы не будем рассказывать о каждой, а остановимся подробнее на Feedreader, так как пользователей Windows у нас все-таки пока гораздо больше.

Скачиваем архив, распаковываем его, начинаем установку. Установка происходит на русском языке. В процессе установки будет предложено установить какие-нибудь фиды из тех, что по умолчанию есть в программе – откажитесь: информации и так будет много, лишней – не надо.

Теперь вам необходимо добавить фиды. Кликаем на новое – создаем новую папку. В нашем примере мы будем создавать ленту новостей по теме грузовики и спецтехника. Поэтому папку мы назовем «грузовики».

И для примера мы рассмотрим, как получить зарубежные новости с Google. Заходим на Google.ru справа мы видим ссылку на Google.com in English – переключаемся. Переходим в News. Теперь вводим наш запрос – по которому мы ищем новости. Для примера возьмем производителя грузовиков и спецтехники Mitsubishi Fuso – зададим поиск по этому запросу. Теперь внимательно смотрим на колонку справа – видим RSS – правой кнопкой кликаем по ссылке – выбираем копировать адрес (копировать ссылку).

Теперь открываем feedreader – кликаем по папке «грузовики». Выбираем вверху новое – новая новостная лента – справа откроется поле, в котором уже будет вставлен нужный нам адрес фида. Нажимаем «хорошо» – и клиент автоматически закачает все последние новости по данному запросу. Можно наслаждаться.

Для добавления любого другого фида – алгоритм аналогичный – кликаем на ссылку на rss, копируем урл, создаем в нужном нам месте новостную ленту и читаем. Ленты группируются в папке – можно прочитать все новости по теме, кликнув на нужную папку. Можно мониторить новости на разные темы, они не будут перемешиваться, так как они размещаются в разных папках. И так далее.

Бывает полезно использовать поиск не только по новостям – но и по блогам. Для гугла – это blogsearch.google.com , а для яндекса – blogs.yandex.ru (ссылка на «rss по запросу» находится справа).

С новостями Яндекса все немного сложнее – Удобнее всего читать их в Яндекс-ленте – там глюков меньше, а вот импорт новостей Яндекса не всегда работает корректно, что жаль. Для англоязычных запросов нам оно не очень-то и надо, а вот для русскоязычных, действительно, не очень удобно. Примерный урл фида с новостной ленты яндекса выглядит вот так – http://news.yandex.ru/yandsearch?rpt=rssnews&text=ЗАПРОС – как задается запрос вы можете посмотреть в том урле который получается после введения соответствующего запроса в Яндекс-новостях.

И теперь, напоследок, самое вкусное – обязательно попробуйте использование «умной новостной ленты», которую предлагает feedreader – это одновременный поиск по блогам, Интернету и новостям (предположительно Google) с использованием индивидуальных настроек. Так можно задать много-много фильтров и сформировать ленту, которая содержит определенные слова в теле новости, не содержит определенные слова в заголовках или все вместе. Очень удобно и позволяет существенно сузить зону поиска, а значит, ограничить поток неподходящей информации.

Помните, что чем более точный запрос вы зададите – тем более информативный ответ вы получите. Но узость запроса – дает и малые результаты. Выбор запросов для поиска информации – задача наиболее сложная, а уж систематизировать результаты, как показывает практика – очень просто с использованием современных технологий. А значит потратьте время на подготовительные работы и это существенно сэкономит ваше трудозатраты в будущем.

26.02.2008

Возврат к списку