Конкордансер

Конкордансер (англ. concordancer) — компьютерная программа для автоматического составления конкорданса, то есть списка примеров употребления слова в минимальном контексте, или перечня всех контекстов, в которых слово или словосочетание встречается в исследуемом тексте. Конкордансеры используют для обработки информации в текстовом корпусе, они позволяют осуществлять поиск в тексте подобно тому, как поисковые системы ищут информацию в Сети[1].

Результат работы конкордансера может послужить входными данными для памяти перевода в составе системы автоматизированного перевода или на первых шагах в машинном переводе. Конкордансеры также используются в корпусной лингвистике для извлечения списков, сортированных в алфавитном или ином порядке, лингвистических данных из какого-либо текстового корпуса, которые затем анализирует языковед.

Был опубликован ряд конкордансеров[2], в частности Оксфордская программа конкордансов[3], которая впервые была выпущена в 1981 году Oxford University Computing Services и используется в более 200 организациях по всему миру[4][5]. TextSTAT — Simples Text Analyse Tool — конкордансер, работающий с корпусами на разных языках и использующий специальный язык запросов (регулярные выражения)[6].

Примечания

  1. EnglishZoom. Что такое электронный корпус текстов | EnglishZoom. www.englishzoom.ru. Дата обращения: 7 февраля 2021.
  2. Архивировано 11 декабря 2016 года. What packages are available
  3. Acronymfinder.com - Oxford Concordance Program (OCP)
  4. Oxford Concordance Program. Review by: Frank O'Brien. Computers and the Humanities Vol. 20, No. 2 (Apr. - Jun., 1986), pp. 138-141
  5. The Oxford Concordance Program Version 2. S. Hockey J. Martin. Literary and Linguistic Computing, Volume 2, Issue 2, 1 January 1987, Pages 125–131, https://doi.org/10.1093/llc/2.2.125 Published: 01 January 1987
  6. Конкорданс - Энциклопедия - Фонд знаний «Ломоносов». www.lomonosov-fund.ru. Дата обращения: 7 февраля 2021.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.