Mozilla коому негизи өзүнүн Firefox браузери менен белгилүү, кыргыз сөзүн таануу системасын түзүү менен бирге эле ал дагы көптөгөн нерселерди жасайт. Аны жакшыртуу үчүн ар бир каалоочу катыша алат. Бул кандай иштейт жана эмне үчүн керек?
МААНИЛҮҮ ТАКТОО: «Клооп» бул система иштеп кетиши үчүн кыйыр түрдө катышып, акысыз жардам көрсөттү жана бул материалдын калыстыгына таасир эткен жок.
Бишкектин тургуну Акпар Мендебаировдун көзү сегиз жашында көрбөй калган. Бул ага юристтик карьера курууга шарт түзүп, университетте сабак берүүгө жана шаарда өз алдынча жүрүүсүнө тоскоол болгон жок.
Смартфон колдонууда ага сокурлугу да жолтоо эмес. Ал «Андроид» операциялык системадасында телефон менен өзүнүн бардык аракеттерин айтып берүүчү talkback функциясын жандырып коёт.
Смартфон колдонгон көптөгөн сокурлардай эле анын угуу жөндөмү укмуштуудай тездик өөрчүтүп, сөөмөйүн болсо экранды басып тез реакция кылууну үйрөнүп алган.
Акпар айрым аракеттерди добуш берүү буйругунун жардамы менен аткарат. Бирок ал аны өзү каалагандай дайыма эле колдоно албайт. Анткени, смартфондордогу колдонмонун орус тилин таануусу жакшы эмес.
Мендебаиров «Бирдей мүмкүнчүлүктөр» социалдык борборунда башка азиз адамдарга смартфонду кандай колдонуу керектигин үйрөтөт. Колдонмолордо орус тилин таануу жакшы эмес болуп жатса, анда кыргыз тили жөнүндө кеп кылуунун деле кереги жок. Анткени смартфондор бул тилди жөн гана түшүнбөйт.
Натыйжада борбордогу ийримге катышкан кыргыз тилдүү азиздер смартфонду Акпар кандай оңой колдоно билсе, ошончолук үйрөнө албай жатышат.
«Кыргыз тилдүү калк орусча сөздөрдү так айта албагандыктан, колдонмо аларды укпай же түшүнбөй калат», — деп түшүндүрөт юрист.
***
Сөздөрдү таануу системасы көзү азиздерге гана керек эмес. Ал текстти үн менен терүү үчүн колдонууга же акылдуу үйдөгү буйруктар үчүн керек.
Ошондой эле, алар ири маалыматтар менен иштөөгө керектелет — мисалы, адамга караганда жасалма интеллектке парламенттин бардык отурумдарын тезирээк талдап, маанилүү сөздөрдү издөө үчүн кыйла эле жеңилдик кылмак. Бирок сокур адамдардан тышкары бул система башкалар үчүн анчейин маанилүү эмес.
Дүйнөдө белгилүү тилдер эбак эле сөздү таануу түзүлүштөргө киргизилген — мисалы, англис тилдүү колдонмолор 1990-жылдардын башында эле орто мерчемдүү адамга караганда сөз байлыгы кеңири болчу.
Кыргыз тили азыркыга чейин мындай түзүлүштөрдө эч кандай көрсөтүлгөн эмес жана Mozilla CommonVoice долбоору — бул анын платформасында сөздү таануу системасын түзүү боюнча алгачкы аракет.
Бул кандайча иштетилет?
Сөздү таануу үчүн жооп берген жасалма интеллект айрым сөздөрдү айырмалай алышы үчүн аны машыктыруу керек.
Ал үчүн түзүлүштүн бул тилдин оозеки үн жаздырмалары менен сүйлөмдөрдүн базасы кеңири болушу керек. Андан соң ал оозеки үн жаздырмаларын жазуу түрүндөгүлөрү менен салыштырууга үйрөнөт.
Бир жерге жүздөгөн кыргыз тилдүү ыктыярчыларды чогултуп, аларды тилдеги бар болгон бардык сөздөрдү оозеки айттырып, жаздыртып алса да болот.
Бирок биринчиден муну уюштуруу оор, ал эми экинчиден бул анчейин деле натыйжалуу эмес — айрым сөздөр контекстке жараша ар кандай маанини билдирет, ошондуктан сүйлөмдөрдүн миллиондогон комбинацияларын жаздыртууга да туура келет жана жүздөгөн адамдын буга абдан көп убактысы кетип калышы мүмкүн.
Ошондуктан Mozilla краудсорсинг деп аталган ыкманы колдонууну чечти — бул интернет аркылуу миллиондогон ыктыярчылардан маалыматтарды акырындык менен чогултуу.
Ал үчүн башында кыргыз тилинде кагазга түшүрүлгөн көптөгөн тексттерди чогултуу керек эле жана ошондон кийин CommonVoiceтун командасы «Клоопко» басылманын кыргыз тилиндеги бардык материалдарын колдонууга уруксат алуу үчүн кайрылмак.
Андан соң «Клооптун» кыргызча макалалары CommonVoiceтун серверлерине жүктөлөт — эми каалоочулардын ар бири система макаланын ичинен кокустан тандап берген сүйлөмдөрдү жаздырып бере алат.
Канчалык үн жана акцент көп жаздырылса, түзүлүш ошончолук тез машыгып, ал айрым кыргызча сөздөр менен маанилүү сүйлөмдөрдү жакшыраак таанууга үйрөнөт.
Буга кантип катышса болот?
Биринчи кезекте сиз долбоордун сайтына киришиңиз керек.
Андан ары эмне кылам? Көрсөтөбүз:
Кийин мунун бардыгын кимдер колдоно алат?
Mozillaнын түзүмү менен философиясы абдан кызыктуу — бул коммерциялык эмес Mozilla Foundation жана Mozilla Corporation коммерциялык корпорациясынын конгломераты.
Mozilla Corporation Google Chrome браузеринин позициясынан бир кыйла төмөн, бирок өз сегментинде лидерлердин бири катары келе жаткан электрондук Thunderbird почта сервиси менен Firefox барузери үчүн жооп берет.
Mozillaнын дээрлик бардык долбоорлорун өз иштерин ачык-айкын лицензиянын алдына чыгарып, жалпы адамзатына аларды акысыз колдонууга уруксат берген Mozilla Foundation жүзөгө ашырат.
Ошондой эле, бул кыргыз сөздөрүн таануу системасына да тийиштүү. Ар бир компания Mozillaнын ишинин жыйынтыктарын колдоно алат.
«Иштеп чыгуучулар биздин колдонуучулардын маалымат базаларын көчүрүп алып, сөздөрдү таануу боюнча системаларын өз алында машыктырып алышса болот», — деп түшүндүрдү CommonVoiceтогу кыргыз тили боюнча долбоорунун авторлорунун бири Жош Мейер.
Ал мисал катары бул маалыматтардын жардамы менен «Андроид» операциялык системасы үчүн кыргыз тилдүү үн жардамчысын иштетип алууга мүмкүн Google компаниясын мисал келтирди. Алар кыргыз компанияларына да жардам бере алышат — мисалы, «Намба такси» бул маалыматтарды өз колдонмосу аркылуу кыргыз тилинде такси чакыруу үчүн үн буйрутмасын колдоно алат.
Mozilla өз жумушунун жыйынтыктарын ачык колдонууга чыгарат, ошондуктан алардын маалымат базасын каалоочулардын ар бири пайдалана алат.
***
Абдыразак Жумабаев — «Равные возможности» борборунун смартфон колдонуу боюнча ийримине барып жаткан кыргыз тилдүү көзү көрбөгөн адамдардын бири.
Ал өз телефонуна кыргыз тилинде үн синтезаторун орнотуп алган (бул сөз таануу системасына окшобогон башкача система) жана ал анын сапатынын начардыгына арызданууда.
«Мисалы, мага синтезатор "Сиздин балансыңызда сто сом" деп келген катты окуп берет. Ушундай кантип болсун, же орусча эмес же кыргызча эмес!», — деп нааразы болду ал.
Абдыразак өз телефону анын буйруктарын түшүнүүсү жөнүндө азыр кыялданууга гана аргасыз.
«Албетте үн башкаргычы менен колдонгум келет. Эң башкысы жакшы иштесе эле болду», — дейт ал.
Бирок Жош Мейер кыргыз тилдүү системанын жакшы иштеши эми бир гана CommonVoiceтун колдонуучуларынан көз каранды болот деп жазууда.
«Күчтүү технология куруу үчүн бизге ар кандай үндөр менен акценттер абдан көп керектелет».
Тексттин үстүнөн иштегендер: Айжамал Джаманкулова, Бектур Искендер
Видео: Гүлжан Эшбаева, Арсений Мамашев, Эдиль Байызбеков