Разработчик натренировал модели OpenAI на интерпретацию человеческого языка в команды терминала

Разработчик представил базовую оболочку на Python, которая позволяет языковой модели OpenAI интерпретировать команды оболочки Linux bash и запускать задачи. Однако проверять запуск команд перед запуском нужно вручную.

По словам автора разработки, OpenAI научилась определять, какую команду Linux запускать на основе письменного описания. Разработанная оболочка использует формат вопросов и ответов и предоставляет модели «примерный контекст» и примеры ввода и вывода.

Автор использовал пример контекста «Команда Linux bash для выполнения задачи» и предоставлял пять примеров для каждого запроса. OpenAI показала способность генерировать команды для основных инструментов Unix, ImageMagick и т. д.

Изначально разработчик планировал выполнять всю процедуру предварительной обработки данных с помощью оболочки на ИИ. Однако ему не удалось выполнить даже основные команды, такие как «sort data.csv по убыванию последнего столбца».

Автор разработки отмечает, что подобную схему можно использовать и с моделью GPT-2. Код оболочки был написан с помощью автозаполнения на основе этой модели.

Для использования оболочки потребуется установить зависимости Python, перечисленные в файле Pipfile (для пользователей Pipenv) или в файле requirements.txt (для пользователей pip), а также действующий ключ API OpenAI и задать для переменной среды OPENAI_API_KEY свой ключ API.

В обсуждении отмечается, что подобная разработка могла бы положить начало развитию удобного голосового помощника для Linux.

Ранее OpenAI сообщила, что после выпуска NLP-алгоритма GPT-3 его используют более 300 приложений. Модель генерирует, в среднем, 4,5 млрд слов в день.

Источник