|
Отечественные разработчики программного обеспечения трудятся над очень интересным и необходимым продуктом. Рабочее название программы - “Секретарь”. С помощью наборов определенных инструкций и баз данных машина сможет понимать казахскую и русскую речь и тут же переводить ее в текст. Зарубежные аналоги этой программы, конечно же, есть, правда, наши языки они не поддерживают. Поэтому и возникла идея создать свое. Сильная сторона “Секретаря” - официальные тексты. Подробнее расскажет Изетали Тилешев, гендиректор ТОО “Фирма ИЗЕТ”, которая занимается разработкой отечественного программного обеспечения
- Расскажите об особенностях этого продукта...
- Мы потратили достаточно времени, чтобы определить, в каком направлении двигаться и верно “объяснить” программе, как правильно понимать человеческую речь и тем самым точно преобразовывать ее в печатные слова и предложения. Было множество вариантов, но мы нашли единственно верный способ. Он оказался очень интересным - его придумала сама природа. Возьмем, например, ребенка - с рождения ему начинают объяснять смысл слов. И у него в памяти формируется база данных, в том числе тембров человеческого голоса. И когда это знание достигает определенной “массы”, он начинает понимать любого человека. Мы тоже решили пойти по этому пути и создали фонетический алфавит русского и казахского языков. То есть в случае с казахским языком мы взяли 42 буквы алфавита и записали их звучание. Также создали фонетический словарь из 120 тысяч слов. После этого мы начали собирать статистику - даем текст человеку, и он начинает читать его. Таких вот голосов в казахскоязычной версии программы у нас уже более 2500. А в русскоязычной версии примерно 2000 образцов голоса. Для чего это необходимо - программа сначала режет слово на куски, сравнивает с фонетическим алфавитом, потом формирует слово и позже из баз данных выбирает нужный вариант.
- Какова точность этой программы?
- В данный момент программа, которая работает с казахской речью, имеет точность на уровне 80 процентов. Русскоязычная пока работает с точностью в 60 процентов. Но когда мы соберем около 10 тысяч образцов голоса, тогда сможем получить точность на уровне 95-98 процентов. И этот результат будет достигнут как в казахскоязычном, так и в русскоязычном варианте программы.
- Где Вы видите использование своей программы?
- Эта программа будет использоваться журналистами, писателями и на всевозможных заседаниях, где по речи спикеров ведется протокол. Кстати, ей заинтересовались также и спецслужбы - программа может использоваться в целях обеспечения национальной безопасности.
- Как быстро происходит обработка информации?
- Все зависит от вычислительной мощности. На обычном персональном компьютере “расшифровка” стандартного предложения занимает примерно 10 секунд. Однако если мы будем использовать многопроцессорные серверы, все это будет происходить практически мгновенно. В то же время есть методы, когда программа быстро пишет, но зато теряет в качестве. А есть методы, когда процесс идет медленно, но зато и точность выше. Мы же избрали в своем продукте, на наш взгляд, самое верное соотношение.
- Есть ли аналоги?
- Да, есть. Для английского, французского, итальянского, немецкого и испанского - в общем, для большинства мировых языков. Разработкой этих программ занимались “Майкрософт” и IBM. К слову, для китайского языка программу создали сами китайцы, для японского - сами японцы. Кстати, японская версия программы была первой. Однако нормально работающих программ, которые бы поддерживали наши языки, к сожалению, нет. Поэтому мы и решили взяться за дело.
- Когда планируете представить коммерческий вариант программы?
- Думаю, что на следующий год мы сможем уже предоставить что-то, что можно продать. Самое главное, нам необходимо расширить базу голосов. И если мы наберем 8-10 тысяч тембров голоса, то уже сможем говорить о реальной работе этой программы. Однако есть и такой момент - финансирование. Например, мы даем текст человеку, но он не будет читать его бесплатно. Поэтому мы оплачиваем его труд. Вообще, в процессе разработки программы было потрачено около 1 миллиона долларов собственных средств фирмы. Впрочем, государство также оказывало нам финансовую помощь. Например, 17 миллионов тенге выделил Фонд науки. В следующем году мы хотим презентовать эту программу в качестве инвестиционного проекта и, собрав средства, будем двигаться дальше. В то же время частным лицам будем продавать эту программу по цене не более 10 долларов за копию. Между тем не исключена возможность работы программы в режиме онлайн. Сейчас уже ведутся переговоры с АО “Казахтелеком” для того, чтобы программа базировалась на их серверах.
Беседовал Алан Байтенов |