Пропуск в контексте

Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat

Введение. Актуальность выполненного исследования состоит прежде всего в том, что все более активное обращение самых широких кругов пользователей к генерации текстов разных жанров, свойств и объёмов с помощью так называемых LLM (Large Language Model, Большая Языковая Модель, БЯМ) порождает необходимо...

Полное описание

Сохранить в:
Библиографические подробности
Главные авторы: Гусаренко, С. В., Гусаренко, М. К.
Формат: Статья
Язык:Russian
Опубликовано: 2024
Темы:
Online-ссылка:https://dspace.ncfu.ru/handle/123456789/29138
Метки: Добавить метку
Нет меток, Требуется 1-ая метка записи!
id ir-123456789-29138
record_format dspace
spelling ir-123456789-291382024-10-08T08:01:41Z Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat Гусаренко, С. В. Гусаренко, М. К. текст генерация LLM языковая модель нейросеть семантический прагматический дефект галлюцинация Введение. Актуальность выполненного исследования состоит прежде всего в том, что все более активное обращение самых широких кругов пользователей к генерации текстов разных жанров, свойств и объёмов с помощью так называемых LLM (Large Language Model, Большая Языковая Модель, БЯМ) порождает необходимость изучения собственно лингвистических возможностей этих генеративных моделей, в том числе необходимость лингвистического исследования порождаемых ими текстов. Немаловажным также представляется тот факт, что большое количество специалистов из разных областей деятельности активно используют генеративные возможности языковых нейросетей в своих сугубо профессиональных целях, из чего следует, что качество генерируемых текстов приобрело статус производственного фактора и непосредственным образом влияет на успех в профессиональной деятельности, что также указывает на актуальность предпринятого нами исследования. Материалы и методы. В качестве объекта исследования были избраны тексты коротких рассказов, поскольку в определенном отношении такого рода тексты могут рассматриваться как архетипические структуры, лежащие в основе текстов некоторых функциональных типов (сценарии, рекламные тексты, рассказы). Анализ. Такое положение дел потребовало изучения сгенерированных рассказов в том числе в аспекте репрезентации в нём фреймовых структур, поскольку это позволяет составить представление о том, как устроены тексты этого типа с точки зрения стандартной языковой семантики, включая синтаксическую семантику. Результаты. Установлено, что при всей грамматической, структурно-семантической и композиционной адекватности, сгенерированные в GigaChatPro тексты коротких рассказов, созданные сетью на определенную тему или по определенному фрейму, могут содержать нарушения в глобально-семантической организации, порожденные как пресуппозициональнопрагматическими нарушениями, так и нарушениями текстовой референции. Отмечены также нарушения в общей функциональной прагматике сгенерированных рассказов: выраженная назидательность, длина предложений в них – 5-7 слов свойственны рассказам для детей младшего школьного возраста, при том, что темы этих рассказов изначально не соответствуют их возрастным интересам. 2024-10-08T08:01:41Z 2024-10-08T08:01:41Z 2024 Статья Гусаренко С.В., Гусаренко М.К. Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat / С.В. Гусаренко, М.К. Гусаренко // Гуманитарные и юридические исследования. – 2024. – Т. 11. – № 2. – С. 368-379. https://dspace.ncfu.ru/handle/123456789/29138 ru Гуманитарные и юридические исследования 2024. № 2; application/pdf
institution СКФУ
collection Репозиторий
language Russian
topic текст
генерация
LLM
языковая модель
нейросеть
семантический
прагматический
дефект
галлюцинация
spellingShingle текст
генерация
LLM
языковая модель
нейросеть
семантический
прагматический
дефект
галлюцинация
Гусаренко, С. В.
Гусаренко, М. К.
Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat
description Введение. Актуальность выполненного исследования состоит прежде всего в том, что все более активное обращение самых широких кругов пользователей к генерации текстов разных жанров, свойств и объёмов с помощью так называемых LLM (Large Language Model, Большая Языковая Модель, БЯМ) порождает необходимость изучения собственно лингвистических возможностей этих генеративных моделей, в том числе необходимость лингвистического исследования порождаемых ими текстов. Немаловажным также представляется тот факт, что большое количество специалистов из разных областей деятельности активно используют генеративные возможности языковых нейросетей в своих сугубо профессиональных целях, из чего следует, что качество генерируемых текстов приобрело статус производственного фактора и непосредственным образом влияет на успех в профессиональной деятельности, что также указывает на актуальность предпринятого нами исследования. Материалы и методы. В качестве объекта исследования были избраны тексты коротких рассказов, поскольку в определенном отношении такого рода тексты могут рассматриваться как архетипические структуры, лежащие в основе текстов некоторых функциональных типов (сценарии, рекламные тексты, рассказы). Анализ. Такое положение дел потребовало изучения сгенерированных рассказов в том числе в аспекте репрезентации в нём фреймовых структур, поскольку это позволяет составить представление о том, как устроены тексты этого типа с точки зрения стандартной языковой семантики, включая синтаксическую семантику. Результаты. Установлено, что при всей грамматической, структурно-семантической и композиционной адекватности, сгенерированные в GigaChatPro тексты коротких рассказов, созданные сетью на определенную тему или по определенному фрейму, могут содержать нарушения в глобально-семантической организации, порожденные как пресуппозициональнопрагматическими нарушениями, так и нарушениями текстовой референции. Отмечены также нарушения в общей функциональной прагматике сгенерированных рассказов: выраженная назидательность, длина предложений в них – 5-7 слов свойственны рассказам для детей младшего школьного возраста, при том, что темы этих рассказов изначально не соответствуют их возрастным интересам.
format Статья
author Гусаренко, С. В.
Гусаренко, М. К.
author_facet Гусаренко, С. В.
Гусаренко, М. К.
author_sort Гусаренко, С. В.
title Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat
title_short Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat
title_full Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat
title_fullStr Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat
title_full_unstemmed Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat
title_sort композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети gigachat
publishDate 2024
url https://dspace.ncfu.ru/handle/123456789/29138
work_keys_str_mv AT gusarenkosv kompozicionnostrukturnyesemantičeskieipresuppozicionalʹnopragmatičeskieparametryidefektysgenerirovannyhkorotkihtekstovvâzykovojnejrosetigigachat
AT gusarenkomk kompozicionnostrukturnyesemantičeskieipresuppozicionalʹnopragmatičeskieparametryidefektysgenerirovannyhkorotkihtekstovvâzykovojnejrosetigigachat
_version_ 1842245441314357248