Лобанов, Борис Мефодьевич

Бори́с Мефо́дьевич Лоба́нов (род. 18 июля 1938) — советский и белорусский учёный в области технической кибернетики[2]. Разработал теоретические основы и методы анализа, синтеза и распознавания речи. Разработал первые в СССР устройства для синтеза русской и белорусской речи[3]. Автор более 300 научных работ по проблемам анализа, распознавания и синтеза речи[4][5][6]. Автор трёх глав первого справочника по искусственному интеллекту, изданного в СССР, посвящённых системам речевого общения[7]. Совершил ряд изобретений в данной сфере[8].

Борис Лобанов
Дата рождения 18 июля 1938(1938-07-18)[1] (83 года)
Место рождения
Страна  СССР,  Белоруссия
Научная сфера компьютерный анализ, синтез речи, распознавание речи
Место работы Объединённый институт проблем информатики Национальной академии наук Беларуси
Альма-матер Минский радиотехнический институт
Учёная степень доктор технических наук
Награды и премии Нагрудный знак «Почётный радист СССР»; 1 серебряная і 2 бронзовые медали ВДНХ СССР; Юбилейная медаль «В честь 80-летия Национальной академии наук Беларуси»

Биография

Борис Мефодьевич Лобанов родился 18 июля 1938 года в городе Прокопьевск (на территории современной Кемеровской области). В 1948 году семья переехала в Минск на постоянное место жительства[9].

Учёба и начало научных исследований

Уже в школе Борис Лобанов увлекся конструированием радиоаппаратуры: в 6-м классе построил свой первый детекторный радиоприемник, в 8-м — ламповый, а в 10-м сконструировал собственную УКВ-радиостанцию. В 1955 году окончил среднюю школу № 13 города Минска и окончательно определился в выборе своей будущей специальности[10][9].

В это время в Минске не существовало вуза подходящего профиля, и Борис Лобанов поступил на отделение «Радиосвязь и радиовещание» Минского электротехникума связи. В техникуме он продолжал оставаться радиолюбителем, организовал первые Республиканские радиосоревнования по «охоте на лис», получил первый разряд по радиоспорту и удостоверение радионаблюдателя за сигналами первого спутника Земли[9].

После окончания техникума в 1958 году Борис Лобанов получил диплом с отличием, но вместо продолжения учебы в вузе был призван на срочную службу в Советскую армию в должности старшего радиомастера (Петрозаводск). Уже в 1959 году, имея достаточную специальную подготовку и хорошо оборудованную приборами радиомастерскую, Борис Лобанов занялся исследованием речи, изучая его с помощью микрофона и осциллографа. В то же время он вступил в переписку с известным учёным, профессором Л. А. Чистович, от которой получил ряд ценных советов по проведению исследований речи. Сохранилась документальная запись в дневнике Лобанова, датированная 25 октября 1959 года: «Фонемофон ведет к фонемографу». Из этой записи видно, что уже тогда Борис Лобанов осознал и определил генеральную стратегию своих будущих речевых исследований: «К распознаванию речи через синтез», которой неизменно придерживался всю дальнейшую научную деятельность[9].

После окончания службы в армии в 1961 году Борис Лобанов поступил в Минский радиотехнический институт (МРТИ) на специальность «Радиотехника» и уже на первом курсе стал председателем студенческого научного общества института, в рамках которого вместе с группой студентов начал разработку анализатора речевых сигналов. В 1965 году, будучи студентом четвертого курса, Лобанов опубликовал свои первые четыре научные работы по анализу речевых сигналов, которые были засчитаны как дипломный проект, что позволило ему закончить институт досрочно. Предложенный в этих работах метод улучшения основных параметров параллельного спектрального анализа эффективно использовался затем при разработке систем распознавания речи[9].

Закончив в 1965 году МРТИ, Борис Лобанов поступил в аспирантуру института и продолжил работать над задачами первичного анализа речевых сигналов для систем распознавания и синтеза речи. В 1968 году он окончил аспирантуру и защитил кандидатскую диссертацию по теме «Некоторые вопросы анализа речевых сигналов»[11].

Научная деятельность в 60-е и 70-е годы

Ещё обучаясь в аспирантуре, в 1966 году Б. М. Лобанов организовал хозрасчетную научную лабораторию анализа и синтеза речевых сигналов при кафедре радиоприемных устройств МРТИ, многие из сотрудников которой еще длительное время продолжали заниматься речевыми исследованиями. В лаборатории под руководством Лобанова впервые в СССР были сконструированы спектроанализатор для речевых исследований «Спектр-1» и прибор для интонографических исследований речи «Интонограф». В это же время в лаборатории проводились исследования методов автоматического выделения фонетических признаков звуков речи, например таких, как «шумный», «звонкий», «гласный», «взрывной». На их основе впервые в СССР было разработано устройство распознавания речевых команд «Сезам-1», отмеченное серебряной медалью ВДНХ СССР[11].

Во второй половине 1960-х годов Б. М. Лобанов принял участие в решении фундаментальной проблемы распознавания речи, связанной с нелинейными искажениями временной оси в процессе произнесения звуков речи. Такого рода искажения создавали существенные трудности при сопоставлении произносимых слов с их эталонами в процессе распознавания речи. В 1968 году независимо и практически одновременно Г. С. Слуцкер (Московский государственный научно-исследовательский институт радио) и Т. К. Винцюк (Институт кибернетики АН УССР) для решения данной проблемы предложили воспользоваться методом динамического программирования (ДП-методом)[11]. В 1969 году Б. М. Лобанов в соавторстве с Г. С. Слуцкером опубликовал статью, в которой было дано дальнейшее развитие ДП-метода для исключительно важного практического случая, когда границы распознаваемого слова неизвестны, то есть для решения задачи обнаружения и распознавания звукосочетаний в непрерывном речевом сигнале. ДП-метод получил в дальнейшем широкое признание зарубежных исследователей[12].

На следующий год после успешной защиты диссертации, в ноябре 1969 года Б. М. Лобанов был направлен на научную стажировку сроком на 10 месяцев в Великобританию. Стажировку по проблемам анализа речевых сигналов Б. М. Лобанов проходил под руководством профессора К. Чери в Имперском колледже науки и технологии (Лондон), а по проблемам синтеза речи — под руководством профессора Р. Лоренца в Эдинбургском университете[12].

После прохождения стажировки в Великобритании основным направлением научной работы Б. М. Лобанова стала разработка методов и устройств синтеза речи по тексту. Еще во время стажировки в Эдинбургском университете им были проведены успешные эксперименты по синтезу звуков русской речи, позволившие заложить основы формантного синтеза речи по фонемному тексту. В результате уже в 1972 году под руководством Б. М. Лобанова был разработан первый в СССР синтезатор русской речи «Фонемофон-1», отмеченный двумя медалями ВДНХ СССР[12]. «Фонемофон» был способен не только синтезировать русскую речь, но и читать введённый текст на нескольких иностранных языках, а также синтезировать пение[13].

В 1973 году Б. М. Лобанову присвоено звание «старший научный сотрудник». В связи с открывающимися перспективами внедрения речевых технологий в отрасли «Связь» на работы Б. М. Лобанова по синтезу русской речи обратило внимание руководство Московского отделения Центрального научно-исследовательского института связи (ЦНИИС). В результате в 1974 году на базе Минского отдела ЦНИИС была открыта Лаборатория речевых систем, руководителем которой Б. М. Лобанов оставался последующие 15 лет. Основным направлением работ лаборатории являлось развитие методов и создание систем автоматического распознавания и синтеза речи, ориентированных на их практическое использование в отрасли «Связь»[14].

Наряду с практической деятельностью по созданию речевых диалоговых систем Б. М. Лобанов уделял большое внимание научно-организационной работе. В 1976 году он организовал и провел в Минске Всесоюзную школу-семинар «Автоматическое распознавание слуховых образов» (АРСО), на которой присутствовало более 200 участников из 75 различных научных организаций СССР. Школа-семинар АРСО проводилась регулярно (каждые два года) до 1991 года, а Б. М. Лобанов с 1976 года входил в постоянно действующий программный комитет АРСО. На семинаре участникам АРСО в Минске был впервые продемонстрирован прототип телефонной справочной системы с синтезированным речевым ответом[15].

В 1978 году Лобанов по приглашению французских ученых был направлен в двухмесячную командировку во Францию для научной работы и ознакомления с работой ведущих научных центров речевых исследований: университетов в Париже, Нанси и Экс-ан-Провансе, а также речевых лабораторий в Тулузе, Гренобле, Орсее и Ланионе. В период пребывания во Франции Лобанов принял участие в конференции по речевой связи и был принят в члены Акустического общества франкоязычных стран[15].

В 1979 году Б. М. Лобанов представлял на Всемирной выставке «Телеком-79» в Женеве новую модель синтезатора речи — «Фонемофон-3», отмеченную дипломом выставки. Известный фантаст Артур Кларк, посетив павильон СССР и ознакомившись с синтезатором речи, записал в книгу отзывов: «Вы предвосхитили мои фантазии из фильма „Космическая одиссея 2001 года»[15][16], а швейцарская газета «Обозреватель» опубликовала статью: «Теперь русские изучают иностранные языки с помощью компьютера, который говорит». За комплекс работ по созданию синтезаторов речи в 1981 году Лобанову присвоено звание «Почетный радист СССР»[15].

Научная деятельность в 80-е годы

В начале 1980-х годов Б. М. Лобанов начал развивать предложенный им метод артикуляторно-формантного синтеза речи по тексту, который был положен в основу нового поколения синтезаторов речи. В 1983 году Б. М. Лобанов в соавторстве с В. Я. Кучеровым издал книгу «Синтезированная речь в системах массового обслуживания»[17].

К началу 1984 года Лобанов создал окончательную формулировку и осуществил теоретическую и экспериментальную разработку единого лингвоакустического подхода к решению проблемы синтеза речи по тексту. Разработанные методы и алгоритмы их реализации легли в основу докторской диссертации «Исследование и разработка методов автоматического синтеза речи по фонемному тексту», которую Лобанов успешно защитил в 1984 году в Институте электроники и вычислительной техники Академии наук Латвийской ССР в Риге. Позднее полученные теоретические и экспериментальные результаты были адаптированы для систем синтеза речи на других европейских языках. В частности, к 1987 году была разработана англоязычная версия синтезатора, демонстрировавшаяся на Всемирном конгрессе фонетических наук и получившая высокую оценку англоязычных специалистов[18].

На 1980-е годы приходится период создания первых промышленных систем синтеза и распознавания речи и их широкого внедрения в отрасли «Связь» СССР при непосредственном участии Б. М. Лобанова и его коллег — Б. В. Панченко, Н. П. Дегтярёва, В. П. Афанасьева. В Калининградском ПО «Кварц» была проведена опытно-конструкторская разработка с последующим серийным производством речевого терминала «Марс-1», включающего подсистемы распознавания речи «Сезам» и синтеза речи «Фонемофон». На базе речевого терминала «Марс-1» была разработана система автоматического информирования абонентов междугородной телефонной сети (АИАМТС) о задолженности за переговоры. Система АИАМТС была успешно внедрена и длительное время эксплуатировалась в ряде крупных городов: Минске, Новосибирске, Алма-Ате, Фрунзе, Петропавловске-Камчатском. Другая система — система контроля за параметрами аппаратуры телефонных и радиостанций с оперативным оповещением дежурного персонала о возникших неполадках — была внедрена на Минской, Московской и Зеленоградской АТС, а также на Белорусской республиканской радиоретрансляционной станции РТС-5[19].

Лаборатория распознавания и синтеза речи

В 1988 году Б. М. Лобанов поступил на работу в Институт технической кибернетики АН БССР по приглашению директора института В. С. Танаева и возглавил вновь созданную Лабораторию распознавания и синтеза речи. Переход Б. М. Лобанова в Институт технической кибернетики совпал по времени с появлением первых персональных компьютеров (ПК) и в планах работ лаборатории появилась тематика, связанная с оснащением ПК системами речевого ввода-вывода информации. Формантный метод, который долгое время играл ключевую роль в системах синтеза речи по тексту, не подходил для этой цели из-за необходимости большого объема вычислений в реальном времени. В 1989 году Б. М. Лобановым был предложен новый микроволновой метод (МВ-метод) синтеза речевых сигналов, в котором вместо вычислений формантных колебаний использовался подготовленный заранее набор микроволн естественного речевого сигнала. Под руководством Б. М. Лобанова МВ-метод был реализован сотрудником лаборатории А. Н. Ивановым в синтезаторе «Фонемофон-5». Компактность его программного обеспечения (всего 64 Кб) позволила оснастить синтезом речи уже первые IBM PC/XT и даже отечественные ПК ЕС-1840. Синтезатор речи был востребован во многих практических приложениях незрячими пользователями. В дальнейшем на основе МВ-метода были разработаны версии для чешского и польского языков, а также автономный одноплатный модуль синтеза речи, украинскоязычная версия которого некоторое время работала на линии киевского метро[20].

Учёные степени и звания

  • 13 сентября 1968 года решением Государственного НИИ радио присвоена учёная степень кандидата технических наук по специальности «Радиотехника и связь».
  • 3 октября 1973 года решением Высшей аттестационной комиссии утверждён в учёном звании старшего научного сотрудника по специальности «Радиоприёмные устройства».
  • 26 апреля 1985 года решением Высшей аттестационной комиссии при Совете министров СССР присвоена учёная степень доктора технических наук по специальности «Техническая кибернетика и теория информации».
  • 19 января 1995 года избран действительным членом (академиком) Международной академии информационных процессов и технологий.

Основные публикации

Монографии

Диссертации

  • Кандидатская (1968): «Некоторые вопросы анализа речевых сигналов» по специальности «Радиотехника и связь». Количество страниц: 150.
  • Докторская (1984): «Исследование и разработка методов автоматического синтеза речи по фонемному тексту» по специальности «Техническая кибернетика и теория информации». Количество страниц: 340.[21]

Некоторые статьи в журналах и материалах конференций

  • Лобанов, Б. М. Автоматическое распознавание звукосочетаний в текущем речевом сигнале / Б. М. Лобанов, Г. С. Слуцкер, А. П. Тизик // Труды НИИР. — 1969. — № 4. — C. 67-74.
  • Лобанов, Б. М. Об автоматическом выделении шумных звуков методом фазовой плоскости / Б. М. Лобанов // Акустический журнал. — М., 1970. — Вып. 3. — С. 24-31.
  • Lobanov, B. Classification of Russian Vowels Spoken by Different Speakers // Journal of the Acoustical Society of America. — 1971. — Vol. 2, № 4 (2). — P. 606—608.
  • Lobanov, B. The Phonemophon Text-to-Speech System // Proceedings of the XI-th International Congress of Phonetic Sciences ICPhS’87. — Tallinn, 1987. — P. 120—124.
  • Lobanov, B. TTS-Synthesizer as a Computer Means for Personal Voice Cloning // Phonetics and its Applications. — Stuttgart: Steiner. — 2002. — P. 445—452.
  • Lobanov, B. A Prototype of the Software System for Study, Training and Analysis of Speech Intonation / B. Lobanov, V. Zhitko, V. Zahariev // Speech and Computer: 20th International Conference, SPECOM 2018, Leipzig, Germany, September 18-22, 2018, Proceedings. — Springer, 2018. — P. 337—346.

Примечания

  1. Беларуская энцыклапедыя (белор.)Беларуская Энцыклапедыя імя Петруся Броўкі, 1996.
  2. Белорусская энциклопедия = Беларуская энцыклапедыя / Редкол. Г.П. Пашков и др. Минск: Белорусская энциклопедия имени Петруся Бровки. — Т. 9. — С. 80. — 560 с.
  3. Lobanov B. History and Development of Speech Science and Technology in USSR (англ.) // Eds. D. Mehnert, D. Kordon, M. Wolff Systemtheorie Signalverarbeitung Sprachtechnologie: Rüdiger Hoffmann zum 65. Geburtstag. — Dresden: TUDpress, 2013. P. 327—338. ISBN 9783944331195.
  4. Boris Lobanov (англ.). «ResearchGate». Дата обращения: 8 октября 2018.
  5. Б.М. Лабанаў (белор.). Лаборатория распознавания и синтеза речи. Дата обращения: 8 октября 2018.
  6. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008.
  7. Искусственный интеллект: Системы общения и экспертные системы, 1990.
  8. Патенты автора ЛОБАНОВ БОРИС МЕФОДЬЕВИЧ. «findpatent.ru». Дата обращения: 8 октября 2018.
  9. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 7.
  10. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 3.
  11. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 8.
  12. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 9.
  13. Фонемофон - Синтезатор человеческой речи созданный в институте связи. 1976 год. Дата обращения: 18 марта 2019.
  14. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 9—10.
  15. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 10.
  16. Лобанов, Б.М. К истории русскоговорящих машин (От голоса робота - к персональному клону голоса человека) // Новости искусственного интеллекта. Москва, 2003. № 1 (55). С. 3—9.
  17. Синтезированная речь в системах массового обслуживания, 1983.
  18. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 10—11.
  19. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 11.
  20. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 11—12.
  21. Исследование и разработка методов автоматического синтеза речи по фонемному тексту. «dslib.net». Дата обращения: 9 октября 2018.

Литература

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.