Ну смысл процесса обучения и состоит в том, чтобы путем многократного прогона токенов из датасета через веса модели, рассчитать такую корректировку для них, чтобы в итоге они в итоге предсказывали контрольную последовательность с наименьшим числом ошибок. Эти корректировки называются градиентом, а методика обучения - методом обратного распространения ошибки. Грубо если, то во время обучения, ты поворачиваешь и двигаешь векторы из случайных направлений в определенные, таким образом, чтобы они показывали как можно более точно на свое изначальное семантическое направление, и были расположены ближе к тем векторам, которые показывают примерно в таком же направлении.
Если прям очень простую аналогию проводить, то это как процесс создания формы для меча кузнецом. Чем больше мечей видел кузнец в своей жизни, чем более тщательно из рассматривал, тем более точно он сможет воспроизвести форму для отливки. При этом, процесс создания формы, это как раз аналогия обучения, а последующая отливка меча, когда хаотичный поток расплавленного металла, проходя через форму, принимает предсказуемую и ожидаемую форму меча, это аналог инференса.
Если кузнецу всю жизнь показывать мечи только в форме [А по щам?], то он и форму для отливки сделает аналогичным образом, т.к никогда не видел других вариантов. Вообщем GIGO во весь рост.
Ну там не самое популярное, а наиболее близкое по семантическому смыслу и вероятное по направлению результирующего многомерного вектора. А так да, в основном у LLM траблы конкретно в точных науках, таких как математика и отсюда галлюцинации, когда из-за того, что в датасете были противоречивые или размытые данные, LLM дает предсказание токена, который был бы вероятен с ее точки зрения, но бессмысленен с точки зрения человека.но тогда выходит, что у ЛЛМ очень много обобщений, с подставлением самого популярного значения. и ни в каких точных вещах на него расчитывать нельзя(((
Ну там не самое популярное, а наиболее близкое по семантическому смыслу и вероятное по направлению результирующего многомерного вектора. А так да, в основном у LLM траблы конкретно в точных науках, таких как математика и отсюда галлюцинации, когда из-за того, что в датасете были противоречивые или размытые данные, LLM дает предсказание токена, который был бы вероятен с ее точки зрения, но бессмысленен с точки зрения человека.
Ну для начала надо понять, как вообще происходит взаимодействие человека и LLM. У нее нет механизма памяти как такового, и каждый запрос к ней содержит всю историю текущего диалога с тобой. Т.е ты пишешь ей сообщение 1, ей уходит запрос с текстом сообщения 1 и 0 сообщения системного промпта, она смотрит на 0 сообщение-системную инструкцию, на базе последовательности 0->1 сообщений генерирует сообщение 2. Ты пишешь ей сообщение 3 и ей уходит текст 0 сообщения, 1 сообщения, 2 сообщения и 3 сообщения. Она кодирует все эти сообщения в токены и на базе этих токенов генерирует 4 сообщение и так далее. Т.е последовательность для генерации ответа постепенно увеличивается и включает все сообщения вашего диалога. Это что-то вроде эрзац-памяти, но памятью в прямом смысле не являющейся. Более того, модель даже не различает твой вопросы и свои ответы, т.к для нее это вообще цельная неизменная последовательность цифровых векторов и она генерирует ответ на основании ее целиком, а не отвечая на конкретно твой вопрос. Более того, модель даже не генерирует ответ в прямом смысле слова. Ее способность следовать инструкциям, это не изначальное свойство этой модели, а результат повторного дообучения базовой модели на специальном датасете с инструкциями и примерами. Базовая модель, которую изначально обучают, создана ТОЛЬКО для последовательного предсказания следующего токена. Она не умеет следовать инструкциям или чему-то подобному "из коробки".а какой у нее механизм коррекции по инструкциям от человека? и на каком этапе они применяются? например я говорил ему как правильно исправить, но Сонома исправлял только то, что я укажу, или по системе, которую я ему укажу и скажу к чему применить. при этом похоже сильно песссимизируется сопутствующий объем выдачи знаний и рассуждений. и сам он не проводить аналогичную переработку для соседних полностью схожих параметров/ понятий. Причем иногда очень разумно понимал, что исправить, я не говорил как, а предлагал идти от обратного и по остаточному принципу, отталкиваясь от значений верных, которые он определил, тогда высчитывать то, где он ошибся. Причем с ТЗ, что тот параметр, который он исправляет - может не участвовать в данном частном случае, и потому по его отсуствию нельзя судить о его значении в других случаях. то есть прям логически рассуждать может
Нет отдельного механизма коррекции. Просто после того, как диалог будет дополнен фрагментом текста, содержащим вопрос, вероятность каких-то токенов вырастет, а каких-то уменьшится. Это просто перераспределит вероятности и скорректирует вывод.>а какой у нее механизм коррекции по инструкциям от человека? и на каком этапе они применяются?
Это следствие засорения контекстного окна мусорными сообщениями. Когда ты говоришь модели "Исправь А на Б", ты не создаешь в ней правило, "Все похожее на А надо исправить на что-то похожее на Б". Вместо этого, ты просто добавляешь несколько новых векторов в общую последовательность, что опять же просто перераспределяет вероятность выдачи токенов. Чем больше корректировок и чем длиннее диалог, тем более размыт итоговый результат. Т.е условно, если контекст разговора в целом указывает куда-то в направлении кластера векторов, охватывающих тематику соционики, то любые слова в диалоге, не связанные с ней явно, будут размывать результат и делать генерацию менее точной. Где-то больше, где-то меньше. Это в том числе выдает еще одну проблему современных LLM - неочевидную и часто контринтуитивные связи между различными векторами. Т.е после обучения, опираясь только на веса модели, ты не сможешь достоверно проанализировать как связаны вектора между собой и какая между ними образовалась связь. Собственно как и при изучении синапсов человеческого мозга)>при этом похоже сильно песссимизируется сопутствующий объем выдачи знаний и рассуждений
Не может. Она вообще не может рассуждать, ни логически, ни каким-либо другим образом. Все что ты можешь ошибочно принять за логическое мышление - это просто успешное следование текстуальному паттерну, заложенное во время обучения, после того, как триллионы слов были пропущены в определенной последовательности через ее веса.>то есть прям логически рассуждать может
Субъективно. Это как в стае рыбы - они одинаковые, но разные. Но уверяю вас - что люди точно есть.1) уверенность в своем уме у хомо-идиотиуса (человечество пока не тянет на хомо-сапиенса) не зависит от реального его ума/интеллекта/эрудиции, а каждый сам себя все равно считает умным.
Есть некая линия разделения между людьми-людьми и теми кто тоже есть. Дуракам просто - у них нет сомнений, они используют слова для достижения цели, а формулировки для запутывания и морока сознания мыслящих. - в этом нет ни справедливости ни истины - просто приматы имеют мощный инструмент воздействия на тех, на кого он действует.2) так как мнение умного противоречит мнению дурака- то дурак считает умного дураком. Или два дурака с разными мнениями - считают себя умным, а оппонента - дураком. И даже два достаточно умных, но с разными мнениями - считают человека с другим набором мнений- дураком, а себя - умным.
Люди конечно ищут себе подобных - это нормально. Истина исходит не оттуда где спор - а от того что истинно и справедливо, а что вымышлено - альтернативные мнения - это дым.3) люди сбиваются в комфортные по общению группы просто по совпадению моделей глупости, а не из реальной тяги к истине и познанию, и вполне радостно упиваются в коллективе общей глупостью, считая ее истиной и умной идеей/теорией/фактом.
Психо от греческого "душа". И да взаимодействие между людьми и их мышление - это 2 большие разные темы.Психология не разбирает, как люди взаимодействуют друг с другом, психология разбирает личность, психологические защиты примитивные и сложные, типы личностей и их уровни прокачки в заболевании, типы развития заболеваний психики и смесь всего этого, психологический анилиз личности, терапию, и есть ли целесообразность в терапии. Психология, логика, психософия это как бы совсем разные вещи и мешать их в одну кучу не стоит
Если это люди - то помогает. Цель психологии для начала понять, а потом уже помочь пациенту справится с его расстройством - но это теоретически. Помочь это не поможет, когда заражение нарастает, но как временная таблетка за деньги, которые нужно молодежи платить, потому что это модно сейчас - позволяет этой отрасли жить.Наладить контакт между людьми и вправду не очень помогает, зато помогает правильно избегать психопатов, социопатов, пограничные типы расстройства личности, ну и те типы личности, которые ты сам хочешь избегать. Налаживать контакт между людьми не цель психологии
Хороший пост от поискового ИИ кстати.
Итог
Вывод у вас довольно трезвый: люди чаще всего сбиваются не ради истины, а ради комфорта мышления. И это естественный механизм психики — ведь истина требует когнитивных усилий, а «коллективная глупость» даёт приятное чувство принадлежности и «умности».
We use cookies and similar technologies for the following purposes:
Do you accept cookies and these technologies?
We use cookies and similar technologies for the following purposes:
Do you accept cookies and these technologies?