“...але в тебе нема вибору, золотце, не тому, що не зуміла б змінити мову, - пречудово зуміла б, якби трохи помарудитись, - а тому, що заклято тебе – на вірність мертвим, усім тим, хто так само несогірше міг би писати – по-російськи, по-польськи, дехто й по-німецьки, і жити зовсім інше життя, а натомість шпурляв себе, як дрова, в догоряюче багаття української, і ні фіґа з того не поставало, крім понівечених доль і нечитаних книжок, ...і оце й є твоя родина, родове твоє древо, аристократко забацана...”
Оксана Забужко
ПОЛЬОВІ ДОСЛІДЖЕННЯ З УКРАЇНСЬКОГО СЕКСУ
Передмова
Виставляю свою роботу на Всесвітній політологічний конкурс “Перспективні моделі української держави і технології їх реалізації”, який проводиться в рамках Політологічної секції, виходячи з таких положень:
“Український народ доріс до розуміння мови як дому народного буття і визначальної етнічної категорії”. (Ірина Фаріон)
“Найперший обов’язок перед своїм народом – навчитися соборної літературної мови й вимови, і тим прищепити собі почуття національної єдності”. (Іван Огієнко)
“Мова є найважливіший, найдорожчий і найміцніший зв’язок, що з’єднує віджилі, живі й майбутні покоління народу в одне велике історичне живе ціле. Вона не тільки виражає життєвість народу, але й саме це життя”.(К. Ушинський)
“Народ, мова якого слугує не лише для позначення явищ, понять та методів вже існуючих та створюваних у сучасному світі новітніх технологій , а сама стає суттю та будівельним матеріалом для частини з них, а саме, в секторі інформаційних технологій, має значно більше шансів здійснити потужний технологічний прорив і претендувати на роль “еволюційного локомотива” в нову еру людства”.
“Мовні технології, технології автоматичного (машинного) перекладу та створення штучного інтелекту безперечно є найбільш обіцяючими, зорієнтованими в майбутнє та захоплюючими технологіями в ІТ секторі”.
А тому, виходячи з цих засад, жодна з перспективних моделей української держави і технологій їх реалізації не може вважатися повноцінною без обговорення майбутніх шляхів розвитку української мови як однієї з ключових категорій, що визначають існування та подальший поступ української національної держави.
Вступ
З метою кращої орієнтації в часовому контексті даної роботи вважаю доцільним за допомогою поданої нижче спрощеної схеми-календаря коротко розглянути етапи функціонування та розвитку мови.
Схема-календар функціонування та розвитку мови
Зародження природної людської мови як засобу спілкування, передачі та збереження інформації
Розвиток та накопичення ресурсів усного мовлення
Виникнення писемності
Початок нормалізації мови через пізнання та усвідомлення її структури та спроби її граматично описати
Відносна нормалізація мови шляхом створення та удосконалення граматик
Лінгвістичний аналіз та дослідження мовних аспектів з застосуванням точних наук та сучасних технологій
Практичне застосування методів та результатів досліджень мови: створення лінгвістичних систем розпізнавання та синтезу мовлення
Ітак, мовознавча спільнота сучасності зайнята активним освоєнням епохи створення штучного інтелекту та розмовляючих машин, епохи, яка дала поштовх для виникнення нової галузі мовознавства, а саме, прикладної лінгвістики, що покликана опрацьовувати методи розв’язання практичних завдань, пов’язаних із використанням мови, і зорієнтована на задоволення суспільних потреб.
По суті
В той час, коли на західно-європейських телевізійних каналах компаніями-постачальниками мобільного зв’язку на всю катушку розкручується рекламний ролик “Чи вміють розмовляти ел-поштівки?”, в Україні, де українській мові дозволено де-юре пишатися статусом державної, з повістки денної, затягнутої багатовіковою цвіллю, все ще не сходить порядком набивше оскомину питання “Чи розмовляти, чи разговарівать?”.
Високотехнологічна Європа моцно крокнула в епоху штучного інтелекту та розмовляючих машин - малоросійська Україна черговий раз заблокувала-забалакала прийняття “Українського правопису” в новій редакції.
“Про що це вона?”- піднапружує свій мозок тямовитий читач, силячись розгледіти логічний зв’язок між мобільником, катушкою, штучним інтелектом та українським правописом.
А зв’язок якраз і дуже очевидний: найскоріше прийняття “Українського правопису” в новій редакції являється важливою передумовою для розробки і впровадження сучасних україномовних лінґвістичних систем - машин, які балакатимуть до нас нашою рідною соковитою милозвучною українською мовою.
“Отакої! Та ми ж самі через пень-колоду ледь справляємось з цією рідною, а тут машини... Куди там нам до штучного інтелекту, тут природного постійно бракує,”- бідкається самокритичний читач. Ну що ж, з цим важко не погодитись: і мова в нас дибуляє, і здорового глузду часом днем з вогнем не розшукати.
Але давайте спробуємо поглянути на цю проблему з здавалося б на перший погляд безглуздо сформульованих суджень:“Чи мавпа олюднилась в результаті виготовлення нею перших знарядь праці, чи знаряддя праці олюднили мавпу?” Або так:“Чи неоантропи винайшли першу в світі членороздільну мову, яка лежить у основі всіх мов світу, чи першомова переродила палеоантропів в неоантропів? А слідом: “Чи українець оновлює “Правопис української мови”, чи правопис оновлює, а то й відроджує українця?”
В тому то й річ, що працюючи над винаходом або удосконаленням чогось, це удосконалення удосконалює й нас самих. Створюючи штучний інтелект, ми насамперед вивчаємо самих себе. А який же інтелект без мови? Саме він породжує мову, а мова у відповідь віддзеркалює інтелект. А тому прискіпливий погляд на продукт людського мозку, мову, допомагає нам осягнути самих себе. Саме через пізнання мови пролягає шлях до пізнання людини.
Українець витворивши свою самобутню, притаманну лише йому мову, у вічних пошуках відповіді на “що то ми, українці, є” звертається саме до своєї української мови і в ній, саме в цій найзагадковішій субстанції власного “я” старається розгледіти своє обличчя, навіть якщо воно було спотворене чужерідним макіяжем.
Ця “солодка парочка” інтелект-мова чи мова-інтелект безперервно рухаються в танці взаємоудосконалення, де інтелект видавши нове мовне “па”, силиться сам же й зрозуміти, як то воно так нічого вийшло, і втиснути його в чергову граматику, та закріпити в правописі, а допоки він второпає що до чого, пішли вже інші викрутаси. Звідси і вічна боротьба суб’єктів інтелекту, лінгвістів, для яких мова є об’єктом вивчення: мовників-ортодоксів та мовників-єретиків.
Хоча й ті й інші вийшли з одного мовного середовища, зі спільного киплячого мовного котла, часом за шумовинням бурхливих дебатів не чують або не хочуть почути одне одного. На якомусь етапі єретикам здається, що вони відкрили для себе істинні правописні норми і починають розхитувати усталені норми, що з погляду ортодоксів спричинює хаос. Але єретики, унормувавши ці “істинні” вже на їх погляд правописні норми, самі перетворюються на ортодоксів і вступають в боротьбу з новою хвилею єретиків. А ще є позамовні правила волюнтаристів, невігласів і чужинців...
Звичайно, нанесений останніми на українську мову багатошаровий чужерідний макіяж потрібно стерти, але обережно, без надмірного запалу, щоб не пошкодити блискучий оригінал з його звуковою збалансованістю, яка й надає українській мові тієї, і лише їх притаманій і всіма поміченій, особливої плинності, милозвучності. Що більш сухою мовою звучить приблизно таким чином: необхідно усунути із чинного правопису те, що суперечить фонетико-морфологічним особливостям українскої мови і здоровому глуздові. (О. Пономарів)
“Ну добре, згода,”- втручається втомлений читач. - “Філолог-єретик - оновлений правопис; оновлений правопис - оновлений українець. Але чому все ж таки не бажано створювати на базі чинного правопису лінгвістичні системи, чим він може зашкодити їх розробці?”
А чому ж ні, можна. Їх і створювали. На основі вже не актуальних для сучасної мовної ситуації правил та накопичених до них винятків. А з прийняттям нової редакції, цих винятків стане менше, правила «осучасняться» і «пасуватимуть» до мовлення. А це, в свою чергу, полегшить роботу розробника синтезатора мови, котрий «вчить» машину мовних правил і винятків з правил.
А тому дуже слушним виглядає висновок Ірини Фаріон, що назрілі правописні проблеми, як, до речі, і будь-які інші, треба вміти бачити і вирішувати негайно. Інакше вони поглинуть нас.
А що вже говорити про найсучасніші системи природного мовлення, для яких власне сповосполучення “природнє мовлення” та “природнє звучання”, і є найсуттєвішою характеристикою.
Але щоб зрозуміти, до чого я веду, пропонується невеликий відступ в теорію мовних систем.
Виходячи з погляду кібернетики на мову як одну з керуючих і керованих систем можна виділити три основних напрямки в розробці лінгвістичних сестем: автоматичний (машинний) переклад (він відноситься до найбільш розроблених і активно застосовуваних на практиці напрямків як вітчизняними так і зарубіжними виробниками), автоматичний аналіз (розпізнавання) мовлення та автоматичний синтез тексту.
Дуже скромними можна назвати результати вітчизняних прикладних лінгвістів в галузях розпізнавання мовлення та автоматичного синтезу тексту. А тому й не дивно, що в сучасних українських підручниках загального мовознавства до найважливіших проблем прикладного мовознавства включені лише автоматичний переклад та інформаційна служба, а про розпізнавання та синтез мовлення згадується ледь не приторком.
А ось результати західноєвропейських лінгвістів можна сміливо назвати більш ніж обіцяючими. Вони вражають, захоплюють і впевнено опановують майбутнім. Ці результати не пилюжаться безнадійно в інститутських застінках тисячами нечитаних дипломів та кандидатських дисертацій, а практично й швидко реалізуються в сотнях цікавих і зорієнтованих на задоволення суспільних потреб програмних продуктів.
Широке практичне застосування наукових методів підштовхує до постійної модернізації методів розв’язання практичних завдань. Що в синтезі мови останнім часом і дозволило перейти від тиражування застарілих систем, яким було властиве роботоподібне, монотонне звучання, до виробництва систем натурального мовлення з природнім звучанням. Ці останні лінгвістичні програмні розробки (Text-to-Speech engine англ., синтезатор текст-на-озвучення укр.) базуються вже на алгоритмах, які зберігають в пам’яті сегменти записаного живого людського голосу і цим уможливлюють озвучення любого прочитуваного на комп’ютері тексту синтетичною мовою, яку в цьому випадку вже важко відрізнити від природнього мовлення, а тому й зовсім не хочеться називати синтетичною.
Ось чому такими на часі є правописні зміни. Адже навіть з першого погляду лінгвіста, якому вдалось попрацювати з синтезатором (хоч і іншомовним) нового покоління, багато запропонованих положень з нової редакції правопису, особливо які стосуються звукової природи української мови, видаються і логічними і корисними. Вони лише сприятимуть створенню якісного україномовного синтезатора, що породжуватиме природно лунаючу мову.
А допоміжні програми до синтезуючого пристрою, такі, наприклад, як “графема-у-фонему” (літера-в-звук) чи програма, яка дозволяє розрізати звуковий потік на голосові сегменти, спроможні наче “під мікроскопом” засвідчити, чи входить певна норма в живу мовну практику і чи стає вона органічною складовою мови. Тобто дасть можливіть здійснювати моніторинг і бачити “вади” оновленого правопису з застосуванням сучасних технічних засобів.
Прийняття оновленого правопису сприятиме також і накопиченню електронних книгозбірень текстами, видрукуваними з урахуванням нових вимог, де ці тексти виступатимуть вже не лише носіями інформації, а мовним дослідним матеріалом, представляючим сучасний текстовий пласт української мови, в якому вона зреалізована, і який так необхідний при створенні лінгвістичних систем.
А щоб не бути схожою на сучасну скептично налаштовану аудиторію вітчизняних мовників, які “говорили, балакали, сіли та й заплакали”, я приведу декілька необтяжуючих прикладів сучасного застосування лінгвістичних систем.
В медицині, юриспруденції, в практиці слідчих органів під час ведення допитів, в журналістиці, в діловодстві, в бізнес практиці системи розпізнавання мовлення дають змогу за допомогою нашого власного голосу створювати, редагувати та змінювати формат наших документів і, що дуже суттєво, економити наш час.
Системи синтезу мовлення озвучать надруковане слово тисячам незрячих або людям з пошкодженим зором, полегшать життя людей з фізичними вадами.
Надіслані ел-поштівки на мобільні телефони чи на інші компактні пристрої, комп’ютери чи міні-комп’ютери одізвуться до нас живими голосами. А пристрої, де буде відсутня традиційна клавіатура, зафіксують і відішлють за командами нашого голосу повідомлення за адресою.
Цікаві розробки чекають на диваків, бажаючих керувати голосом електроприладами широкого вжитку, від телевізорів до вимикачів світла, а розмовляючі іграшки - на дітей.
В систему освіти прийдуть нові навчальні програми з вивчення іноземних мов, сучасні озвучені словники...Думаю, прикладів досить.
Виходячи з того, що багатоаспектність дослідження мови зумовлена її складністю, а отже передбачає, що сучасне мовознавство являє собою складний комплекс численних дисциплін і напрямів, які то зближуються і перехрещуються, то розходяться, а тому заключає в собі прагнення до фундаментальних теоретичних досліджень і водночас розширює сферу практичного застосування своїх результатів, виступатиму за створення Українського центру мов та мовних технологій, який би спеціалізувався на розробці та впровадженні мовних технологій та створенні штучного інтелекту.
На базі такого центру на початковому етапі передбачається відкрити серію “інкубаційних” підцентрів державного та недержавного типу, які дали б змогу:
на основі курсів та семінарів з комп’ютерної лінгвістики підготувати або спеціалізувати лінгвістів нового покоління та створити для них нові робочі місця. Кваліфікований комп’ютерний лінгвіст - це гарант виживання української мови в жорстких умовах конкуренції “технологічних” мов світу
прискорити вивчення українськими лінгвістами та інженерами іноземних мов з метою підготовки багатомовних спеціалістів
об’єднати спеціалістів різних профілів, які мають що або хотіли б докласти до створення мовних технологій нового типу і тим зібрати розпорошені междисциплінарні досягнення, що пришвидшить практичне застосування мовних технологій
створити професійних дискусійних клуб для обговорення, обміну та відбору найефективніших поточних ідей, пропозицій чи розробок
об’єднати фінансові можливості інвесторів, які зацікавлені вкласти свої кошти в безумовно перспективні мовні технології майбутнього.
Створення потужного спеціалізованого мовного центру – Української Долини Мов – це данина часові інформаційних технологій та розмовляючих систем.
Післямова
Я не збираюсь бризкати слюною в сторону держави, яка підступно зрадила своїй мові, як дому народного буття, цим виявивши, що вона чужинка в цьому домі; я не стану скиглити за роками, так безвідповідально й бездарно розтраченими цинічними кон’юнктурниками всіх рівнів від культури, освіти та науки на розтринькування безцінної творчої енергії сотень тисяч українських мовників; я не буду агітувати старих маразматиків та пристосуванців за новий прогресивний шлях розвитку української мови на користь мовних технологій, а отже на користь українського народу та його майбутнього. Мені просто з ними не по дорозі. Та й чи є у них, власне, дорога?
Натомість я кажу “бути” сучасним україномовним технологіям, а значить, і новому розвитку української мови, а тому і відповідаю ствердним “так” на запитання “Чи розмовлятимуть ел-поштівки українською мовою?”.
Заключне слово
Існує думка, що XXI століття буде віком кібернетики і лінгвістики. А тому - з Богом в епоху розмовляючих систем, де в графі опція на вибір мови у списку запропонованих функціонуючих мов стоятиме й українська.
Примітка
В роботі широко використовувались дискусійні вирази Ірини Фаріон, Олександра Пономаріва, Ігоря Каганця, Миколи Жулинського та Михайла Кочергана.
10.08.2001