1) генерация – процесс автоматического создания нового контента (текста, изображения, звука) на основе данных и заранее установленных правил;
2) модели искусственного интеллекта (ИИ) – процесс внедрения технологий и алгоритмов ИИ для обработки данных на казахском языке в различные системы, приложения или платформы;
3) обработка естественного языка – технология машинного обучения, которая дает компьютерам возможность интерпретировать, манипулировать и понимать человеческий язык.
Национальный словарный фонд казахского языка формируется на основании академических и переводческих словарей, Национального корпуса казахского языка, терминологической базы и датасет, который является совокупностью данных различных форматов. Национальный словарный фонд казахского языка является общедоступной государственной информационной системой, - отмечается в проекте приказа.