Хабар телеарнасы

Алматыда «Қазақ тілінің ұлттық корпусы» деп аталатын смарт база таныстырылды

Алматыда «Қазақ тілінің ұлттық корпусы» деп аталатын қазақ мәтіндерінің смарт базасы таныстырылды.

Корпусқа кірген кез келген қолданушы өзі іздеген сөз туралы толыққанды жан жақты тілтанымдық ақпарат ала алады. Жобаны Ахмет Байтұрсынұлы атындағы тіл білімі институтының мамандары жасап шыққан. Бүгін стенд-конференцияда тіл мамандары үш жылдағы ғылыми зерттеулерінің нәтижелерін жұртшылық назарына ұсынды. Атап айтқанда, екі ғылыми монография, латын әліпбиі негізіндегі қазақ жазуының лингвистикалық базасы ғылыми ортаға жол тартты. Сондай-ақ, институттың қорындағы 5 миллионға жуық қазақ сөзінің картотекалық қоры толықтай цифрлы форматқа көшірілді. «Қазақ тілінің ұлттық корпусы» смарт базасын жетілдірсек, ұлттық жасанды интеллект жасауға мүмкіндік мол», - дейді тілтанушылар.

Анар Фазылжан, А.Байтұрсынұлы атындағы тіл білімі институтының директоры: 
- Параллель мәтіндер корпусы бар. Яғни Абай жолының бір сөйлемінің орысша аудармасы қасында қоса тұрады. Тағы басқа да осы параллель корпустың базасына түскен мәтіннің орыс тіліндегі аудармасы қасында тұратын болады. Және ол мәтіндердегі кез келген сөзді бассаңыз, ол сөз туралы толық лингвистикалық ақпарат алатын боласыз.