ШЛЯХИ ВІДНОВЛЕННЯ ТЕКСТОВОЇ ІНФОРМАЦІЇ, ПРЕДСТАВЛЕНОЇ У ВИГЛЯДІ ЛОГІКО-ЛІНГВІСТИЧНОЇ МОДЕЛІ
DOI:
https://doi.org/10.31649/1997-9266-2021-157-4-70-77Ключові слова:
текстова інформація, природна мова, логіко-лінгвістична модель, алгоритм відновленняАнотація
Обґрунтовано актуальність вирішення проблеми пошуку змістовних зв’язків в електронних текстових документах з метою подальшого їх порівняння за змістом та удосконалення роботи систем виявлення плагіату. При цьому важливим етапом є оцінювання достовірності сформованих формальних моделей. Тому метою цієї статті є дослідження алгоритму автоматичного аналізу логіко-лінгвістичних моделей електронних текстових документів для відтворення текстової інформації, що об’єднує в собі основні властивості тексту та його складових частин, відображає основні взаємозв’язки між структурними компонентами. Логіко-лінгвістична модель текстового документу представляє собою впорядковану четвірку та масив логіко-лінгвістичних моделей речень природної мови, що входять до тексту. Автором запропоновано декілька шляхів відновлення текстової інформації, що відштовхуються від структури логіко-лінгвістичної моделі електронного текстового документу, яка містить лінгвістичну та семантико-синтаксичну складову. Описано схеми здійснення відновлення текстової інформації, вибрано комбінований спосіб, що передбачає аналіз семантико-синтаксичної складової паралельно з аналізом текстової бази, зокрема, її компоненти – множини пропозицій, що містить зв’язки між логіко-лінгвістичними моделями речень тексту електронного текстового документу. Розроблено алгоритм відновлення текстової інформації, представленої у вигляді формальної логіко-лінгвістичної моделі електронного текстового документу, описано його етапи. Всі кроки алгоритму продемонстровано на прикладі аналізу конкретної заданої логіко-лінгвістичної моделі фрагменту електронного текстового документу. Проведено експерименти щодо відновлення текстової інформації для текстів наукового стилю. Виявлено, що до основних факторів, що впливають на відновлення текстової інформації, належить зняття омонімії, а також різна інтерпретація синонімічних конструкцій та інваріантних форм логіко-лінгвістичних моделей речень природної мови.
Посилання
Кабінет Міністрів України, Постанова № 556. [Електронний ресурс]. Режим доступу: https://zakon.rada.gov.ua/laws /show/380-2021-%D0%BF#n10 .
Проєкт «Ініціатива академічної доброчесності та якості освіти». [Електронний ресурс]. Режим доступу: https://saiup.org.ua/pro-proekt/.
«Академічна доброчесність: виклики сучасності,» в Збірник наукових есе учасників дистанційного етапу наукового стажування для освітян (Республіка Польща, Варшава, 28.01 – 08.02.2019). Варшава, 2019. 171 с.
Understanding & Preventing Plagiarism [Online]. Available: https://www.accreditedschools online.org/resources/preventing-plagiarism/. Accessed on: April 15, 2021.
Nur E. Hafsa, “Plagiarism: A Global Phenomenon,” in Journal of Education and Practice, vol. 12, no.3, pp. 53-59, 2021.
A. Vavilenkova “Regularity of context units identification in electronic text documents,” CEUR Workshop Proceedings, 2845, pp. 1-10, 2021.
J. Kahre, The mathematical theory of information, New York: Springer Science, 2002, 502 p.
М. М. Глибовець, А. М. Глибовець, і М. В. Поляков, Інтелектуальні мережі, Дніпропетровськ: Нова ідеологія, 2014, 462 c.
V. Shyrokov, “System semantics of explanatory dictionaries,” Cognitive Studies, no12, pp. 95-106, 2015.
N. Khairova, S. Petrasova, and A. P. S. Gautam, “The Logical-Linguistic Model of Fact Extraction from English Texts,” Communications in Computer and Information Science, vol. 639. Springer, Cham. 2016. https://doi.org/10.1007/978-3-319-46254-7_51 .
О. Г. Оксіюк, «Моделі подання знань в інтелектуальних системах навчання,» Збірник наукових праць Військового Інституту Київського національного університету імені Тараса Шевченка, т. 28, с. 98-101, 2010.
Д. В. Ланде, І. Ю. Субач, і Ю. Є. Бояринова, Основи теорії і практики інтелектуального аналізу даних у сфері кібербезпеки: навч. посіб., К.: ІСЗЗІ КПІ ім. Ігоря Сікорського, 2018, 300 с.
И. Р. Гальперин, Текст как объект лингвистического исследования. 5-е изд. Москва: КомКнига, 2007, 144 с.
А. І. Вавіленкова, Аналіз і синтез логіко-лінгвістичних моделей речень природної мови, монографія, К.: ТОВ «СІК ГРУП УКРАЇНА», 2017, 152 с.
A. Vavilenkova, “Basic principles of the synthesis of logical-linguistic models,” Cybernetics and systems analysis, vol. 51(5), pp. 826-834, 2015. http:// doi.org/10.1007/s10559-015-9776-z .
К. А. Филлипов, Лингвистика текста. Курс лекций, Спб.: Издательство С.-Петербургского университета, 2008, 336 с.
O. V. Bisikalo, W. Wojcik, O. V. Yahimovich, and S. Smailova, “Method of determining of keywords in English texts based on the DKPro Core,” Technology Audit and Production Reserves, 1/2(21), pp. 26-30, 2015.
https://doi.org/10.15587/2312-8372.2015.37274 .
А. І. Вавіленкова, «Особливості бази знань системи автоматизованої побудови логіко-лінгвістичних моделей текстових документів,» Вісник Національного університету «Львівська політехніка». Серія «Інформаційні систем та мережі»: зб. наук. праць, № 9, с. 75-83, 2021. https://doi.org/10.23939/sisn2021.09.075 .
##submission.downloads##
-
PDF
Завантажень: 118
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, згодні з такими умовами:
- Автори зберігають авторське право і надають журналу право першої публікації.
- Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
- Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).