Автор: Грант С. Ингерсолл, Томас С. Мортон, Эндрю Л. Фэррис
Издательство: ДМК Пресс
Год: 2015
ISBN: 978-5-97060-144-0
Формат: pdf
Страниц: 414
Размер: 10,1 Мб
Язык: Русский
В книге описаны инструменты и методы обработки неструктурированных текстов. Прочитав ее, вы научитесь пользоваться полнотекстовым поиском, распознавать имена собственные, производить кластеризацию, пометку, извлечение информации и автореферирование. Знакомство с фундаментальными принципами сопровождается изучением реальных применений. Издание предназначено для читателей без подготовки в области математической статистики и обработки естественных языков. Примеры написаны на Java, но сами идеи могут быть реализованы на любом языке программирования.