√ќ—“ – 52873-2007 —»Ќ“≈«ј“ќ–џ –≈„» ƒЋя —ѕ≈÷»јЋ№Ќџ’  ќћѕ№ё“≈–Ќџ’ –јЅќ„»’ ћ≈—“ ƒЋя »Ќ¬јЋ»ƒќ¬ ѕќ «–≈Ќ»ё. “ехнические требовани€

Speech synthesizers of special computer workplaces for invalids on sight. Technical requirements
ƒата публикации:2010
Twitter Facebook Vkontakte

ќтказ от ответственности

¬ силу объективных причин, а также из-за неконструктивной позиции ‘едерального јгентства по техническому регулированию и метрологии, администраци€ портала не гарантирует очное соответствие формы и содержани€ публикуемого документа его официальному оригиналу. ¬се риски, св€занные с прочтением, дальнейшим распространением и использованием этого документа, читатель принимает на себ€. ≈сли вы будете продолжать чтение текста на этой странице, то это будет означать, что вы согласны с указанными услови€ми.

ѕредисловие

÷ели и принципы стандартизации в –оссийской ‘едерации установлены ‘едеральным законом от 27 декабр€ 2002 г. N 184-‘« "ќ техническом регулировании", а правила применени€ национальных стандартов –оссийской ‘едерации - √ќ—“ – 1.0-2004 "—тандартизаци€ в –оссийской ‘едерации. ќсновные положени€".

—ведени€ о стандарте
1 –ј«–јЅќ“јЌ Ќегосударственным учреждением "»нститут профессиональной реабилитации и подготовки персонала ќбщероссийской общественной организации инвалидов ¬сероссийского ордена “рудового  расного «намени общества слепых "–еакомп" (Ќ” »ѕ–ѕѕ ¬ќ— "–еакомп")
2 ¬Ќ≈—≈Ќ “ехническим комитетом по стандартизации “  381 "“ехнические средства дл€ инвалидов"
3 ”“¬≈–∆ƒ≈Ќ » ¬¬≈ƒ≈Ќ ¬ ƒ≈…—“¬»≈ ѕриказом ‘едерального агентства по техническому регулированию и метрологии от 27 декабр€ 2007 г. N 551-ст
4 Ќасто€щий стандарт разработан по заказу ‘едерального агентства по здравоохранению и социальному развитию в рамках федеральной целевой программы "—оциальна€ поддержка инвалидов на 2006-2010 годы", утвержденной ѕостановлением ѕравительства –оссийской ‘едерации от 29 декабр€ 2005 г. N 832
5 ¬¬≈ƒ≈Ќ ¬ѕ≈–¬џ≈

»нформаци€ об изменени€х к насто€щему стандарту публикуетс€ в ежегодно издаваемом информационном указателе "Ќациональные стандарты", а текст изменений и поправок -в ежемес€чно издаваемых информационных указател€х "Ќациональные стандарты". ¬ случае пересмотра (замены) или отмены насто€щего стандарта соответствующее уведомление будет опубликовано в ежемес€чно издаваемом информационном указателе "Ќациональные стандарты". —оответствующа€ информаци€, уведомление и тексты размещаютс€ также в информационной системе общего пользовани€ -на официальном сайте ‘едерального агентства по техническому регулированию и метрологии в сети »нтернет

√ќ—“ – 52873-2007
Ќј÷»ќЌјЋ№Ќџ… —“јЌƒј–“ –ќ——»…— ќ… ‘≈ƒ≈–ј÷»»
—»Ќ“≈«ј“ќ–џ –≈„» ƒЋя —ѕ≈÷»јЋ№Ќџ’  ќћѕ№ё“≈–Ќџ’ –јЅќ„»’ ћ≈—“ ƒЋя »Ќ¬јЋ»ƒќ¬ ѕќ «–≈Ќ»ё
“ехнические требовани€

Speech synthesizers of special computer workplaces for invalids on sight. Technical requirements

ƒата введени€:2009-01-01
ќ —11.180.30 , 35.180
ќ ѕ40 3320

1 ќбласть применени€

Ќасто€щий стандарт распростран€етс€ на синтезаторы речи дл€ специальных компьютерных рабочих мест, примен€емые инвалидами по зрению.

2 Ќормативные ссылки

¬ насто€щем стандарте использованы нормативные ссылки на следующие стандарты:

  • √ќ—“ – ћЁ  958-93 »нтерфейс цифровой звуковой
  • √ќ—“ – 51645-2000 –абочее место дл€ инвалида по зрению типовое специальное компьютерное. “ехнические требовани€ к оборудованию и производственной среде

ѕримечание -ѕри пользовании насто€щим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользовани€ -на официальном сайте ‘едерального агентства по техническому регулированию и метрологии в сети »нтернет или по ежегодно издаваемому информационному указателю "Ќациональные стандарты", который опубликован по состо€нию на 1 €нвар€ текущего года, и по соответствующим ежемес€чно издаваемым информационным указател€м, опубликованным в текущем году. ≈сли ссылочный стандарт заменен (изменен), то при пользовании насто€щим стандартом следует руководствоватьс€ замен€ющим (измененным) стандартом. ≈сли ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, примен€етс€ в части, не затрагивающей эту ссылку.

3 “ермины, определени€ и сокращени€

3.1 ¬ насто€щем стандарте применены следующие термины с соответствующими определени€ми:
3.1.1 программа экранного доступа: ѕрограммное средство дл€ чтени€ текстовой информации и озвучивани€ действий пользовател€ с помощью синтезаторов речи и/или отображени€ того же посредством брайлевских дисплеев.
3.1.2 синтезатор речи:  омплекс технических и программных средств, преобразующих текст, составленный на различных €зыках, в звуковой сигнал, воспринимаемый слушателем как аналог человеческой речи при различных степен€х разборчивости и естественности звучани€.
ѕримечание -»сходный текст передаетс€ дл€ преобразовани€ в цифровом виде с различных носителей информации или по цифровым лини€м св€зи. —интезаторы речи могут быть разделены на моно€зычные (например, только русский €зык) и много€зычные (например, русский и английский и др.); программные (функционирующие на базе технических и программных средств) и аппаратные (действующие на базе технических средств). —интезаторы речи следует отличать от устройств речевой индикации, которые могут выдавать речевые сообщени€, состо€щие из ограниченного числа слов и фраз, начитанных диктором и хран€щихс€ в пам€ти устройства (в том числе персонального компьютера), например в тифлоприборах (говор€щие часы, тонометр, озвучивание клавиатуры лифта и т.д.).
3.1.3 разборчивость речи: ќбеспечение правильного воспроизведени€ и корректного распознавани€ речи при прослушивании, в том числе и при повышении скорости воспроизведени€ (определ€етс€ экспертным методом).
3.1.4 специальное компьютерное рабочее место инвалида по зрению: –абочее место, включающее в себ€ комплект средств вычислительной техники на основе персонального компьютера, оснащенного специальными устройствами и специальным программным обеспечением, позвол€ющими инвалиду по зрению выполн€ть профессиональные об€занности.
3.1.5 просодическа€ информаци€: ѕреобразованный в последовательность звуков текст.
3.1.6 цифрова€ фильтраци€: ќбработка отсчетов цифрового сигнала дл€ получени€ требуемой амплитудночастотной характеристики сигнала.
3.1.7 дифоны: ”частки речевого сигнала, включающие в себ€ переходы между звуками.
3.1.8 фонема: ћинимальна€ смыслоразличительна€ единица устного €зыка, имеюща€ временную упор€доченность.
3.1.9 аллофоны: ‘онетически обусловленные (специфические) комбинаторные и позиционные варианты данной фонемы.
3.1.10 субаллофоны: —оставные части аллофонов, необходимые дл€ формировани€ их звуковых сочетаний.
3.1.11 формантный метод: ћетод формировани€ речевого сигнала, при котором звук формируетс€ формантным вокодером (без использовани€ базы естественных звуковых единиц) на основе поступающей к нему просодической информации.
3.1.12 параметры синтезируемой речи: »змен€емые характеристики синтезируемой речи (тип голоса, скорость речи, тон и тембр голоса, ударение и произношение).
3.1.13 операционна€ среда:  омплекс программных и технических средств, обеспечивающих выполнение прикладных программ.

3.2 ¬ насто€щем стандарте применены следующие сокращени€ и условные обозначени€:
SAPI (Speech Application Programming Interface) Ч программный интерфейс речевых приложений, используемый в операционных системах Microsoft Windows;
ANSI Чтип кодировки текстовых данных в операционных системах Microsoft Windows;
PCM Чформат представлени€ данных.

4 “ехнические требовани€

4.1 ќбщие требовани€

4.1.1 —интезатор речи (аудиодисплей) примен€ют в составе специального компьютерного рабочего места инвалида по зрению по √ќ—“ – 51645.

4.1.2 ѕрограммные средства синтезатора должны соответствовать √ќ—“ – ћЁ  958.

4.1.3  ачество синтезируемой речи должно быть таким, чтобы пользователь не испытывал напр€жени€ при прослушивании речевых сообщений.

4.1.4 »нтерфейс программных средств синтезатора должен быть разработан в соответствии с требовани€ми SAPI версии 5.1. ¬ыполнение требований SAPI версии 5.1 должно гарантировать успешную работу программных средств синтезатора с Microsoft Windows приложени€ми.

4.2 “ребовани€ к входным и выходным данным

4.2.1 ѕрограммные средства синтезатора речи должны поддерживать формат входных текстовых данных в кодах ANSI (Win-1251). ѕрограммные средства синтезатора речи должны автоматически определ€ть тип кодировки.

4.2.2 ‘ормат выходных звуковых данных должен иметь следующие параметры:
-отсчеты сигнала -в формате PCM 16 разр€дов, моно;
-частота дискретизации от 8000 до 44100 √ц.

ѕримечани€
1 –екомендуема€ частота дискретизации 22000 √ц.
2 –екомендуетс€ наличие внутренней возможности генерировать звук на стандартных частотах 11025, 16000, 22050 √ц.

4.2.3 ѕрограммные средства синтезатора речи должны позвол€ть:
а) выбирать тип голоса диктора (рекомендуетс€ два мужских и два женских);
б) измен€ть громкость, скорость воспроизведени€ речи, подстраивать частоту основного тона, тембр, эффект реверберации (настраиваемые параметры области регулировани€).

ѕримечание -ѕодстройка тембра должна осуществл€тьс€ путем цифровой фильтрации нижних и/или верхних частот с переменным коэффициентом усилени€.

4.3 јлгоритм работы программных средств

4.3.1 ѕрограммные средства синтезатора речи должны состо€ть из следующих блоков:
-текстовый процессор;
-транскриптор;
-звукова€ база;
-формирователь речевого сигнала;
-блок вывода звука.

4.3.2 “екстовой процессор, который получает в качестве входной информации текстовые данные, должен выполн€ть следующие функции:
а) выделение предложений в тексте и разбивка их на синтагмы;
б) прочтение заголовков электронных писем и документов;
в) анализ использовани€ "е" и "Є";
г) выполнение задачи омонимии;
д) расстановка ударений в словах, при этом должна быть предусмотрена возможность использовани€ словар€ ударений;
е) определение типа интонации предложени€, формирование интонационного контура;
ж) определение места установки и длительность пауз в чтении.

4.3.3 “ранскриптор должен преобразовывать полученный от текстового процессора нормализованный текст с ударени€ми, расставленными паузами, интонационным контуром в последовательность просодической информации, т.е. преобразовывать текст в последовательность звуков.  аждому звуку должны соответствовать требуемые длительность и частота основного тона.

4.3.4 ‘ормирователь речевого сигнала на основе потока просодической информации от транскриптора, использу€ звуковые элементы из звуковой базы, должен сформировать речевой сигнал. –абота формировател€ речевого сигнала зависит от того, какой тип звуковой базы используетс€ и есть ли она вообще. ≈сли звукова€ база не используетс€, то синтезатор должен формировать звуковые элементы сам на основе формантного метода (формантный синтезатор). “акой метод синтеза самый экономный, но качество речи невысокое (сильно роботизированное).

4.3.5 –екомендуетс€ использовать синтез речи на основе звуковых баз, состо€щих из дифонов, аллофонов, субаллофонов или смешанного типа, т.к. по качеству такой метод намного эффективнее формантного и обеспечивает хорошую разборчивость.

ѕримечание -—тепень естественности речи очень сильно зависит от качества и состава собранных звуковых единиц, а также используемых алгоритмов модификации звука по частоте основного тона и длительности.

4.3.6 ѕрограммные средства синтезатора должны быть реализованы в виде отдельной программы и должны иметь блок вывода звука. — помощью соответствующих стандартных интерфейсов программные средства синтезатора должны формировать звуковой поток данных на звуковую карту компьютера.

4.4 ќбъемно-временные характеристики программных средств

4.4.1 —корость преобразовани€ текста в звук должна превышать скорость звучани€. ѕрограммные средства синтезатора должны преобразовывать текст быстрее, чем он выдаетс€ через звуковую карту. ѕри этом процент загрузки центрального процессора не должен превышать 25% (при тактовой частоте процессора 3 √√ц).

4.4.2 ќбъем требуемой оперативной пам€ти не должен превышать 120 ћб. –азмер файлов программных средств синтезатора не ограничиваетс€. ќграничени€ на объем пам€ти и файлов программных средств синтезатора могут быть установлены дл€ программных средств синтезатора, реализуемых на платформе с ограниченными ресурсами (Palm, карманные персональные компьютеры, мобильные телефоны). ¬ этом случае ограничени€ диктуют выбор платформы.

4.5 “ребовани€ надежности программных средств синтезатора

4.5.1 ѕрограммные средства синтезатора должны обеспечивать корректную и устойчивую работу программ экранного доступа в процессе их взаимодействи€.

4.5.2 ѕрограммные средства синтезатора должны обеспечивать устойчивость работы при воспроизведении текста, обрабатывать любые сочетани€ символов и не завершать обработку данных аварийно (зависание, зацикливание операционной среды).

5 Ёргономические требовани€

5.1 ѕрограммные средства синтезатора речи должны включать в себ€ возможность регулировки скорости речи при неизменной высоте основного тона. ¬ качестве норматива скорости синтеза речи устанавливаетс€ средн€€ скорость воспроизведени€ на уровне 90 слов в минуту.

5.2 ѕрограммные средства синтезатора должны включать в себ€ возможность регулировки высоты основного тона при неизменной скорости речи.

5.3 ѕрограммные средства синтезатора должны включать в себ€ возможность регулировки громкости звучани€.

5.4 ѕрограммные средства синтезатора должны обеспечивать необходимую степень разборчивости речи.

ѕримечание -—тепень разборчивости речи определ€етс€ экспертным методом. –ечь считаетс€ разборчивой, если она пон€тна пользовател€м при средней скорости воспроизведени€ в диапазоне от 80 до 180 слов в минуту.

5.5 ѕрограммные средства синтезатора должны обеспечивать пользователю комфортные услови€ работы, которые включают в себ€ такие параметры как слитность воспроизведени€ звуков в словах, разборчивость речи, близость голоса к человеческому и другие, т.е. характеристики, которые вли€ют на утомл€емость пользовател€ при прослушивании больших массивов информации.

ћетки

—интез речи, —тандарты и спецификации


–аспространение материалов сайта означает, что распространитель прин€л услови€ лицензионного соглашени€.
»де€ и реализаци€: © ¬ладимир ƒовыденков и јнатолий  амынин,  2004-2021