Вам нужно для начала определиться с терминологией.
LLM - это большая ЯЗЫКОВАЯ модель, которая работает с текстовыми данными на входе и на выходе.
Если использовать LLM для управления ПОВЕДЕНИЕМ ботов, то это потребует колоссальные ресурсы и будет работать очень медленно и с большими задержками даже для ОДНОГО бота. Если вы хотите использовать LLM для обеспечения возможности разговаривать с игроками, то это возможно, но результат будет очень хреновым на текущем этапе развития и опять же локально обеспечить работу такой модели не удастся, т.к даже если дообучить модель на корпусе логов чатов, получится ерунда(если у вас там конечно нет 2-3 тб размеченных и очищенных логов чата и пары сотен тысяч долларов на файнтюн, без гарантии результата.)
Если вы хотите использовать просто нейронную сеть для моделирования поведения, то для того, чтобы заставить бота корректно принимать решение, опираясь на данные игрового мира, потребуется довольно серьезная нейронка, обучение которой аналогично будет стоить очень дорого, т.к количество факторов на которые она должна реагировать, исчисляется сотнями. Собрать и РАЗМЕТИТЬ датасет для обучения такой нейронки, разработать ее архитектуру - это задача с бюджетом опять же в сотни тысяч долларов, если не миллионы(лол, я не шучу).
Линеечка не настолько сложная игра, чтобы задействовать нейронку под такие задачи. Все(кроме разговоров с игроками) намного быстрее и качественнее решается обычным кодом.