АЛГОРИТМ ВИЗНАЧЕННЯ СХОЖОСТІ ТЕКСТІВ НОВИН НА ОСНОВІ ПОЛІНОМІАЛЬНОГО ХЕШУВАННЯ

Автор(и)

  • М. О. Гранік Вінницький національний технічний університет
  • В. І. Месюра Вінницький національний технічний університет

Ключові слова:

новини, порівняння новин, поліноміальне хешування

Анотація

Запропоновано алгоритм порівняння текстів новин на основі поліноміального хешування. Алгоритм може бути використаний для кластеризації текстів новин. 

Біографії авторів

М. О. Гранік, Вінницький національний технічний університет

аспірант кафедри комп’ютерних наук

В. І. Месюра, Вінницький національний технічний університет

канд. техн. наук, доцент, професор кафедри комп’ютерних наук

Посилання

1. Singhal Amit. Modern Information Retrieval: A Brief Overview / Singhal Amit // Bulletin of the IEEE Computer Society Technical Committee on Data Engineering. — 2001. — 24 (4). — P. 35—43.
2. Матеріали курсу Data Mining, що викладався у University of Utah [Електронний ресурс]. — Режим доступу до ма-теріалів : http://www.cs.utah.edu/~jeffp/teaching/cs5955/L4-Jaccard+Shingle.pdf .
3. Karen Spärck Jones. A statistical interpretation of term specificity and its application in retrieval / Karen Spärck Jones // Journal of Documentation. — 2004. — No. 60. — P. 493—502.
4. Lovins Julie Beth. Development of a Stemming Algorithm / Lovins Julie Beth // Mechanical Translation and Computational Linguistics. — 2006. — No. 11. — P. 22—31.
5. All About Stop Words for Text Mining and Information Retrieval [Electronic resource] // Text Mining, Analytics & More. — Access mode: http://www.text-analytics101.com/2014/10/all-about-stop-words-for-text-mining.html .

##submission.downloads##

Переглядів анотації: 168

Опубліковано

2016-09-05

Як цитувати

[1]
М. О. Гранік і В. І. Месюра, «АЛГОРИТМ ВИЗНАЧЕННЯ СХОЖОСТІ ТЕКСТІВ НОВИН НА ОСНОВІ ПОЛІНОМІАЛЬНОГО ХЕШУВАННЯ», Вісник ВПІ, вип. 4, с. 75–79, Верес. 2016.

Номер

Розділ

Інформаційні технології та комп'ютерна техніка

Метрики

Завантаження

Дані завантаження ще не доступні.