AI & LLM
38
Вес: Критический

Проект Heretic на GitHub: инструмент для полного снятия цензуры с текстовых нейросетей

Itest Ua 30.12.2025 — 14:17

Ключевые факты

  • 1 Проект Heretic позволяет полностью обойти встроенную цензуру в больших языковых моделях (LLM).
  • 2 Инструмент работает путем автоматического подбора оптимальных внутренних параметров модели, обходя механизмы безопасности (RLHF).
  • 3 Эффективность подтверждена на тестах: процент отказов Google Gemma 3 снизился с 97% до 3%.
  • 4 Heretic совместим со всеми типами LLM.
  • 5 Для работы требуется локальный запуск модели и наличие компьютера средней мощности или выше.

Проект Heretic, разработанный под ником p-e-w, представляет собой инструмент для автоматического «джейлбрейка» больших языковых моделей (LLM). Он использует методы оптимизации для поиска набора внутренних параметров, которые эффективно обходят механизмы безопасности и фильтры, установленные разработчиками (например, RLHF/SFT). Разработчик утверждает, что Heretic работает со всеми типами моделей и позволяет генерировать контент, который ранее был заблокирован из-за политики безопасности. В качестве доказательства эффективности приводится тестирование на модели Google Gemma 3, где частота отказов в выполнении потенциально опасных или нежелательных запросов снизилась с 97% до 3%. Для использования инструмента требуется локальный запуск модели и, соответственно, компьютер средней мощности или выше, что необходимо для процесса поиска оптимальных параметров. Проект доступен бесплатно. 💡 Фактчекинг: Информация подтверждена. Проект Heretic (автор p-e-w) доступен на GitHub и использует автоматический подбор параметров для обхода цензуры LLM. Заявленные показатели эффективности (снижение отказов Gemma 3 с 97% до 3%) соответствуют данным, представленным разработчиком.

Источник