Набор текста на китайском языке

(Советы для незрячих пользователей компьютера)
Дата публикации:10.05.2022
Дата обновления:23.06.2022
Поделиться в Twitter Поделиться в F******k Поделиться в VKontakte Поделиться в Telegram

Вместо предисловия

На борту: Microsoft Windows 8.1 pro 64 бит, NVDA, синтезатор vocalizer expressive 1.1 с китайским голосом Tian-tian (диалект мандарин). Раскладка клавиатуры - Chinese (simplified, China) Microsoft Wubi. И ещё — iOS и iPadOs с таким же синтезатором речи. Устройство с операционной системой Android не использовалось по причине его отсутствия.

Предполагается, у читателя есть некоторые познания в китайском языке, а поэтому он сможет разобраться в изложенном материале.

Доступность изучения языка

Доступен ли китайский для незрячих? Краткий и утвердительный ответ - да. А теперь — подробности:

  1. Научиться говорить - нет проблем, но китайский, как известно, есть не алфавитный, а иероглифический язык. Иначе говоря, нет никаких шансов научиться языку на слух в полной мере.
  2. Научиться писать рукой тоже нет проблем, ежели кому есть вашу руку брать и начёртывать этот текст. Вопрос только в том, что придётся затратить слишком много времени и сил, а процесс обучения требует помощи со стороны зрячего.
  3. Итак, нужно решить проблему самостоятельного освоения языка без помощи зрячего ассистента.

О системах записи иероглифов

Ещё в середине 20-го столетия была разработана и повсеместно распространена фонетическая запись китайских иероглифов под названием пиньинь. Цитата (ссылки в этой статье приводиться не будут, ибо информацию по теме найти в интернете легко):

Ханьюй пиньинь (широко известная просто как пиньинь) - универсальная латинская транскрипция китайских иероглифов, которая в настоящее время используется в качестве основной в словарях, документах, компьютерных технологиях. Разработана в КНР 1958 году, окончательно утверждена правительством страны в 1979 году. Наиболее широко используется на международном уровне, в том числе в ООН.

Один из методов ввода иероглифов и заключается в том, чтобы вводить латинскими буквами китайский текст. Удобно? Как считаете?

Другой метод набора иероглифического текста заключается в том, чтобы вводить иероглифы графическими кусочками, элементарными графическими единицами — графемами. Так можно набрать любой иероглиф. Что же удобнее? Набирать латиницей или графемами?

Существуют две системы набора иероглифов с помощью графем - wubi и Changjie. Wubi используется для набора упрощённых иероглифов, а Changjie - для традиционных. Следует заметить, что для набора традиционных иероглифов можно использовать и более свежие версии Wubi, в частности, для кантонского языка. Автору настоящей статьи понадобилось целых полгода, чтобы разобраться в этих системах.

Чтобы понять, что латиница никак не подходит незрячему человеку для ввода иероглифического текста, давайте проанализируем следующие примеры. Они очень простые, но весьма наглядны. Здесь нет необходимости вводить иероглифический текст . В квадратных скобках будет указываться фонетическое написание, как принято в пиньине.

  1. В китайском языке слова "он", "она" и "он, она оно" (для вещей и животных) произносится абсолютно одинаково [ta1]. Но графически значки отображаются по-разному.
  2. Слова "быстрый" и "кусок" [kuai4], как видно, произносятся тоже одинаково.
  3. Слова "перед" и "деньги" [qian2] звучат одинаково.

Из этих примеров видно, что в китайском языке часто встречаются омофоны, то есть похожие по звучанию, но разные по смыслу слова. А вот омографы встречаются гораздо реже.

Сравнение методов ввода китайских иероглифов

Если вводить текст латиницей, то в силу ранее отмеченной особенности китайского языка возникнет вопрос, как однозначно ввести нужный иероглиф. При использовании раскладки Microsoft Chinese pinyin возникнет следующая ситуация.

Откроем блокнот, выберем эту раскладку и напечатаем:

ta1

И перед нами появится список иероглифов, по умолчанию в списке первым будет "он", но там будут ещё несколько, как минимум два, иероглифа. придётся гулять по этому списку (при помощи NVDA это делать несложно). Но визуального контакта нет, и даже если бы и был, то набор текста превращается в сплошную муку. Набор текста происходит крайне медленно. Но дело не только в скорости, а дело ещё в том, что у незрячего нет уверенности, правильно ли он набирает текст. И неважно, китаец ли он или нет. Китайцу, правда, намного легче, он может нажать комбинацию клавиш и услышать описание иероглифа. Это, как пользователь программы экранного доступа нажимает горячку, чтобы услышать "м" - Михаил или "н" - николай". Абсолютно точно также, можно услышать описание китайского иероглифа. Но так как китайский язык автору ещё мало знаком, этот метод явно не подходит, нет уверенности в правильном наборе именно нужного иероглифа.

Помимо этого, само описание иероглифов уж больно большое. Автор открывал файл описания иероглифов. Понял, что это было сделано отт лени, словно взяли и скопировали целый словарь.

На iPhone ситуация значительно лучше, так как иероглиф описывается предельно лаконично, а главное, однозначно. Можно, например, выбрать клавиатуру пиньинь и набирать латиницей, а затем пальчиком сверху выбрать нужный иероглиф, слушая его описание. Но всё равно остаётся чувство неуверенности при наборе латиницей.

Ввод иероглифов, основанный на графемах, в указанном отношении значительно лучше. Пожалуй, только таким способом можно однозначно набрать нужный иероглиф. Но есть одна сложность. Нужно знать сочетание клавиш для набора иероглифа. Эту информацию можно найти в интернете, Это открытый источник. Есть самоучители, правда, на английском языке.

Автору известны два метода набора иероглифов графемами. Ранее по тексту эти методы указывались. Но так как автор изучает китайский язык, который используется в КНР, то для набора текста использует метод wubi (пять черт).

Краткое описание метода Wubi

Для эффективного освоения этого метода необходимо понять структуру иероглифа. Нет, незрячему нет необходимости представлять изображение иероглифа. Ему нужно понимать структуру знака: из каких элементарных элементов он состоит. Элементарный элемент есть радикал. Всего существует 214 радикалов. Порядковый номер радикала нужен для словарей, чтобы упорядочивать иероглифы. Незрячему нужно лишь уловить, так сказать, смысл "однокоренных" слов.

Русский язык. Школа. Урок. Задание: подберите однокоренные слова для слова "дом", "хлеб"! Подобрали? Хорошо.

Но это не совсем так для китайского языка. Примеры будут приведены далее. А пока разберёмся с этим методом.

Набор китайского текста происходит очень просто. Нажимаем сочетание клавиш, а затем — клавишу Пробел и иероглиф автоматом прописывается в поле редактирования. Между китайскими иероглифами пробел савить не надо. Это не правильно. Если вы вместо пробела нажмете клавишу Enter, то ничего не произойдёт. Будет пустая строка, но уже следующая.

Существует три версии этого метода ввода иероглифов - wubi86, wubi98 и wubi new century. Вы можете изучать любую из них, но автор использует пока wubi86, так как она самая распространённая. Китайцам, видать, тоже стало накладно набирать текст латиницей, уж больно медленно. А особенно тем, кто должен набирать текст профессионально быстро и грамотно.

Теперь давайте вернёмся к вышеприведенным примерам, но уже с комбинациями клавиш для ввода нужного иероглифа. Откроем блокнот, переключимся на раскладку Chinese (simplified, China) Microsoft Wubi. Далее, просто используем нижеследующие комбинации клавиш, не забывая нажимать клавишу Пробел для пропечатывания иероглифа. Или же возьмем iPhone или iPad, откроем заметки или сообщения, в общем, там, где можно набирать текст. Переключимся на заранее добавленную клавиатуру, а клавиатуру можно добавить так же, как и любую другую.

  1. он [ta1] - wb
  2. она [ta1] - vbn
  3. он, она, оно (для вещей и животных) [ta1] - px
  4. быстрый [kuai4] - nnw
  5. кусок [kuai4] - fnw
  6. перед [qian2] - ue
  7. деньги [qian2] - qg

Как видно из примеров, каждый иероглиф имеет своё сочетание клавиш. На первый взгляд, нет никакой логики, но и на второй и третий и многочисленное количество взглядов нет никакой логики. Только если системно подойти к этому вопросу, то можно уловить, хоть какую-то, пусть и притянутую за уши логику. Но вот эта логика и есть нечто важное не только для незрячих, а для всех вообще, кто занимается китайским языком.

С биологической точки зрения люди все одинаковы более или менее. У нас, людей физиологические процессы проходят примерно одинаково. При формировании мысли и ассоциативных связей происходят теже самые биохимические реакции. А стало быть, механизм формирования логики одинаков. Это всё на низком уровне, а на более высоком надстроечном уровне правила могут быть разными.

Нам, незрячим трудно на первых или каких-либо порах запомнить эти абра-кадабрические сочетания клавиш. Точно также и зрячим нелегко запомнить начертания иероглифов. В итоге выходит, что мы со зрячими находимся примерно в равных условиях.

А теперь о логике запоминания этих сочетани клавиш.

Радикалы китайского языка

Нужно обзавестись соответствующим словарём. Не будем же изобретать велосипед. Иероглиф "человек" [ren2] - это простой иероглиф под порядковым номером 9:

человек [ren2] - w

Иероглиф "Он" разлагается на два радикала "человек" и "тоже, также":

тоже, также [ye3] - bn

Иероглиф "Она" разлагается на два радикала "женщина" (порядковый номер 38) и "тоже, также"

женщина [nu:3] - vvv

Иероглиф "светлый, яркий" разлагается на два радикала "солнце" (72) и "луна" (74).

солнце [ri4] - jjjj
луна, месяц [yue4] - eeee
светлый, яркий [ming2] - je

Таким же образом раскладываются на радикалы и другие иероглифы. Это очень помогает при ассоциативном запоминании.

Есть иероглифы, которые состоят более чем из двух радикалов. Самый простой иероглиф, это и есть радикал.

В современном китайском языке стараются избегать всякого рода омонимий, поэтому многие слова состоят из двух иероглифов. Есть слова, состоящие более чем из двух иероглифов. Но так как пробел между ними никак не возможно соотнести как разделитель, то бывает трудно понять границы слова, да это и не нужно. Считайте, что у вас есть конструктор лего. Кубики можно сложить только по указанным правилам. Несколько примеров слов, состоящих из двух и более иероглифов:

  1. "электричество" плюс "мозги" - компьютер.
  2. "огонь" плюс "повозка" - поезд.
  3. "стопа" плюс "мяч" - футбол (калькирование).
  4. "корзина" плюс "мяч" - баскетбол.
  5. "любовь" плюс "человек" - супруг.
  6. "рождение" плюс "солнце" - день рождения.

Название месяцев и дней недели понять крайне просто. Месяцы так и называются — первый месяц, второй месяц,.. двенадцатый месяц. Дни недели — Первый день недели ,.. шестой день недели. Воскресение переводится как "день недели" или же "неделя" плюс солнце.

Немного о брайле

В китайском языке (КНР) существуют две системы записи по бралю. Также имеется одна система по брайлю в Тайване (тайваньски китайский - другая история, традиционные иероглифы и другая фонетическая система, хотя в 2009-м году и на Тайване используется пиньинь).

У этих систем есть существенный недостаток. Они основаны на фонетическом принципе записи иероглифов. Другими словами, за основу взяли пиньинь. Ну, а если эти сочетания клавиш писать по брайлю, то мы получим такой текс, какой он должен быть. Не придётся выдумывать новые знаки препинания и прочие знаки. Достаточно писать все латинские буквы без указания признака алфавитной заглавной или маленькой буквы. А между сочетаниями клавиш ставить пробел, это будет точно соответствовать написанному. Ведь, когда мы нажимаем Пробел, то иероглиф прописывается. Вот небольшой пример текста из книги, который подготовил автор:

Начало BRF файла:
TX G YJS4 WQIN VB6 WQIN
KHGM VTG8
WF YTD #A4 D SM FNRT
,M- WQIN VB6 ,L- WQIN VB6
WQIN J GCG GMY VGO IH VEG
KCG8 ,M- CF KB1Q KN GCG GMY
VGO4 ,L- WQIN KHGM VTG8 ,M- Q
VTG WVT DNV YAD VFF4 ,L- WQIN
WLAD W KCG8 ,M- J KB1Q J WW
AATU GO R1YGE UKD WQIN KN WFH
TC QK PB KNX8 ,L- Q VTG YJ1KN
IQ JE4 Q GO RUV WQIN4 ,M- DY
VB B6 YW YKW WQIN TVE YM IW6
,L- Q BN TVE YM IW6 Q WU H LG
KC6
Конец BRF файла.
Первый урок. Здравствуйте!
Как вас зовут?
диалог 1. В Аэропорту
(далее перевод не приводится)

По просьбе автора эту книгу распечатала одна из библиотек. Автор не будет указывать, в какой библиотеке материал подготовлен. Если библиотека пожелает, она сама заявит о себе. Да и всё равно текст набран на китайском. Это всего лишь первая попытка читать тексты таким образом.

Китайский текст по брайлю получается весьма компактным. Но при желании можно ещё сильнее сократить текст. До четырёх иероглифов на четыре латинские буквы.

Таким образом можно набирать брайлевские книги на китайском без потери качества и оригинала. Можно подготовить liblouis таблицу, и программа автоматом отработает эту задачу. Не хочется убеждать кого-либо в правоте или отстаивать свою точку зрения. Известно, что в Китае такой способ не используется. Главное, есть такая возможность. но хорошо это или не хорошо, соблюдать оригинальность текста - пусть каждый решает сам.

О других языках

Следует кратко поговорить о других языках, поддерживающих иероглифическую запись.

В корейском языке наблюдается тенденция отказа от иероглифов в пользу алфавита. Алфавит - хангыль, но иероглифы используются для записи имён, фамилий и других названий. Думается, что с точки зрения доступности проблем не должно быть, так как текст в основном алфавитный. Автор никак не касался корейского языка, поэтому не берётся подробно обсуждать данную проблему.

В японском языке, как известно, существуют три системы записи текста.

  • Хирагана служит для записи служебных слов.
  • Катаканой записывают слова иностранного происхождения.
  • Канджи( китайские иероглифы) используют для записи корней слов или понятий.

В тексте нет пробелов между словами. Сложность заключается в том, чтобы правильно выбрать нужный знак. NVDA озвучивает описание иероглифов и кану. Но всё-таки получается как-то муторно. Сложно не только незрячему, изучающему японский, но также и незрячим носителям языка. Всё время приходится перепроверять. Японский тоже, как ни странно, страдает омофонией.

Кану, разумеется, набирать очень просто, достаточно набирать латинскими буквами. Если читатель пожелает, то он может набирать текст не латинскими буквами, а каной. Просто нужно будет в настройках клавиатуры установить соответствующий флажок.

Существуют некоторые соглашения по набору каны латинским алфавитом.

У Автора установлен тот же набор, но в качестве японского синтезатора выступает kyoko. Открываем блокнот и пытаемся записать всем известное выражение "konnitiwa" - здравствуйте, добрый день. Алгоритм простой. Используется одно из соглашений записи каны. Это соглашение было почерпнуто автором из книги по брайлю на Эсперанто "Enkonduko en la Japanan" Ямасаки Сеико. Также можно писать "konnichiwa".

  1. открываем словарь хоть онлайн, хоть офлайн. И находим там это выражение.
  2. Видим, что выражение записывается двумя иероглифами плюс частица "ha".
  3. Слышим, что синтезатор читает по отдельности каждый символ из трех совершенно не так, как ожидается на первый взгляд, но всё нормально. каждый иероглиф по отдельности имеет собственное произношение.
  4. Пытаемся записать в блокноте с включённой японской раскладкой так:
    ko-nn-ni-ti-ha -
    (служебная частица "wa" всегда записывается как "ha". Разумеется, знак "дефис" между слогами писать не нужно).
  5. Если нажать клавишу Пробел, будет выделен первый из предложенных системой вариантов, и он окажется верным. Выбор нужно подтвердить клавишей Enter.
  6. Если же нажать клавишу Enter сразу, то текст запишется каной. Для переключения на хирагану нажимаем Ctrl + Capslock, а на катакану — Alt + Capslock. По умолчанию выбрана хирагана.
  7. Для перемещения по списку вариантов (кандидатов) пользуемся горячими клавишами: Вперёд - Пробел, назад - Shift + Пробел. Слушаем озвучиваемое синтезатором описание иероглифов и каны. Подтверждение выбора - Enter.

Полезно обратиться к руководству пользователя программы экранного доступа NVDA. Вам предстоит настроить параметры композитного ввода под себя. Это касается как японского, так и китайского языков. В параметрах композитного ввода автор предпочёл всё выключить.

исходя из вышеприведенного алгоритма, набор японского текста выглядит довольно утомительным. Да и нет уверенности, что текст будет введён корректно. А Чтобы воспринимать на слух описания каны и иероглифов, нужно, как минимум, уже понимать японский.

Решается эта проблема следующим образом.

  1. Нужно установить раскладку Chinese (traditional, Taiwan) microsoft Changjie.
  2. Разумеется, японская раскладка тоже нужна.
  3. настроить горячие клавиши таким образом, чтобы можно было быстро и оперативно менять раскладку между этими двумя языками.
  4. Остаётся лишь переключаться между раскладками и набирать иероглифы графемами.
  5. И самое главное, не забывать поглядывать в словарь. Не будет лишним убедиться, что пишете ВЫ правильно. МЫ ведь тоже заглядываем в англо-русский словарь, чтобы посмотреть произношение слова.

Сложность только в изучении системы Changjie, но нужно выучить всего лишь пару тысяч иероглифов. Ну, по крайней мере, этот список можно найти в открытом доступе. На взгляд автора, эту систему можно и под брайль заточить. По той же методике, что было указано для китайского языка. Кану записывать традиционным брайлем, как принято в Японии, а канджи уже писать латинскими буквами без признаков алфавита методом Changjie.

Вместо заключения

Цель статьи - просто и понятно объяснить методику ввода текста на китайском языке. Поскольку для этого необходимо изучать радикалы, то от метода ввода переходим к изучению китайского языка в целом. Хочется надеяться, что читатель ухватил саму идею и сможет реализовать свое желание изучать китайский и японский языки, а статья послужит для этого отправной точкой.

Для самостоятельного изучения китайского языка автор использует многочисленные материалы в электронном виде, в том числе собранные на просторах всемирной паутины. Из доступных онлайн тренажёров можно порекомендовать duolingo. Автор сам зависает в этом приложении.

Ещё раз следует подчеркнуть, автор намеренно не указывал ссылок. Эти материалы лежат в открытом доступе.

Модифицированное описание китайских иероглифов

Описание иероглифов для NVDA

Ранее уже было сказано, что описания иероглифов в программе экранного доступа NVDA слишком громоздки для восприятия начинающими изучать китайский язык. На iOs и iPadOs устройствах, напротив, описания довольно лаконичны. Автор решил исправить этот недочёт и модифицировал соответствующий файл.

Теперь если загрузить архив, извлечь файл characterDescriptions.dic и поместить его в каталог C:\Program Files (x86)\NVDA\locale\zh, согласиться на замену существующего файла, то мы получим лаконичное описание иероглифов по нажатию соответствующей клавиши. Однако целесообразнее вместо замены переименовать имеющийся файл или сделать его резервную копию, например, добавить знак подчёркивания перед именем файла. Путь указан для установочной версии NVDA в операционной системе Microsoft Windows 8.1 (64-разрядная). Вам необходимо скорректировать этот путь с учётом варианта установки NVDA и версии операционной системы.

Метки

NVDA, Доступность


Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2022