Лекции: Методы автоматического сбора и сбора данных по примерам

100512 TSYS
Две лекции от Владимира Батыгина (Яндекс) по сбору и обработке данных
26 февраля 2011: Автоматический сбор данных по примерам

Скачать видео 127,93 МБ

29 декабря: Методы автоматического сбора данных

Скачать презентацию в .pdf

Скачать видео 540.50 МБ

В настоящее время в интернете наблюдается стремительный рост количества полезной для пользователей информации. Чтобы в ней хорошо ориентироваться, нужны все более умные поисковые системы, собирающие не просто тексты, а структурированную информацию. За её сбор отвечает направление web content mining. В докладе рассказывается об этом направлении, а также дается обзор методов ведущих специалистов в этой области.

Для себя посмотреть определения: xpath, treepattern

 

Вы можете оставить комментарий ниже.