Архив журнала

О МИНИМАЛЬНОМ ЧИСЛЕ ВЫСОКОТОЧНЫХ N-ГРАММ, НЕОБХОДИМЫХ ДЛЯ РАСПОЗНАВАНИЯ АВТОРА ТЕКСТА (58-59)





Дата публикации статьи в журнале: 04/09/2019
Название журнала: Международный журнал Содружество, Выпуск: 17, Том: 1, Страницы в выпуске: 58-59
Автор: Косимов А.А.
, Худжандский политехнический институт Таджикского технического университета им. акад. М.С.Осими ,
Автор:
, ,
Автор:
, ,
Анотация: Путем применения метрического классификатора удалось идентифицировать авторов убывающих по высокочастотных униграмм (с учетом пробела) от 36 до 6, при размера текстовых фрагментов 4000 слов, для биграмм (с учетом пробела) от 1296 до 55 (2500 слов) и для триграмм (с учетом пробела) от 46656 до 1000 (1250 слов)
Ключевые слова: таджикский язык  N-грамма  метрика  классификатор              
DOI:
Данные для цитирования: Косимов А.А. . О МИНИМАЛЬНОМ ЧИСЛЕ ВЫСОКОТОЧНЫХ N-ГРАММ, НЕОБХОДИМЫХ ДЛЯ РАСПОЗНАВАНИЯ АВТОРА ТЕКСТА (58-59). Международный журнал Содружество. Физико-математические науки. 04/09/2019; 17(1):58-59.

Скачать в формате PDF


Список литературы: 1. Усманов З.Д., Косимов А.А. Цифровой образ “Шахнаме” (“Книги царей”) А.Фирдауси – Доклады Академии наук Республики Таджикистан, 2014, т.57, № 6, с. 471-476. 2. Усманов З.Д., Солиев О.М. Проблема раскладки символов на компьютерной клавиатуре.– Душанбе: Ирфон, 2010, 104 с. 3. Усманов З.Д., Косимов А.А. Частотность букв таджикской литературы – Доклады Академии наук Республики Таджикистан, 2015, т.58, № 2, с. 112-115. 4. Косимов А.А. Оценка эффективности использования униграмм при идентификации текста – Доклады Академии наук Республики Таджикистан, 2017. 5. Усманов З.Д., Косимов А.А. Частотность биграмм таджикской литературы – Доклады Академии наук Республики Таджикистан, 2016, т.59, № 12, с. 28-32. 6. Косимов А.А. Оценка эффективности использования биграмм при идентификации текста – Доклады Академии наук Республики Таджикистан, 2017. 7. Усманов З.Д., Косимов А.А. О распознавании авторства таджикского текста – Доклады Академии наук Республики Таджикистан, 2016, т.59, № 3-4, с. 114-119. 8. Косимов А.А. Оценка эффективности использования триграмм при идентификации текста – Доклады Академии наук Республики Таджикистан, 2017. 9. Косимов А.А. О минимальном объёме текста, необходимого для распознавания его автора – Доклады Академии наук Республики Таджикистан, 2017. 10. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики.– Москва: Наука, Гл. ред. физ-мат. литературы, 1983, 416 с. 11. Усманов З.Д. N-граммы в распознавании однородных текстов.– Материалы 20 научно-практического семинара "Новые информационные технологии в автоматизированных системах".– Москва, 2017, с. 52-54. 12. Турсун С. Нисфирўзї.– Душанбе, 1973, 25с


14 просмотров
  Другие архивы