Минулого тижня я додав Mira до конвеєра, який вже працював.



Нічого особливого. Вона витягує положення з контрактів і надсилає їх до класифікатора далі по ланцюгу. Точність моделі була прийнятною. Затримка — теж. Ніхто не скаржився на продуктивність.

Проблема не була у моделі.

Проблема була у затвердженні.

Кожне витягнуте положення все ще потрібно було переглянути людині, перш ніж воно могло просуватися далі. Не тому, що модель була погана. А тому, що відповідність не цікавиться рівнями впевненості. Їх цікавить доказ. У політиці буквально написано «людська валідація». Ця фраза не змінюється просто тому, що покращуються бенчмарки.

Тому замість того, щоб знову сперечатися про точність моделі, я спробував щось інше.

Я встановив SDK Mira.
Вказав його на кінцеву точку. Додав ключ. Запустив перший виклик.

Відповідь виглядала нормально. Якщо дивитися лише на вихід, не можна було подумати, що щось змінилося.

Різниця з’явилася у логах.

Перше положення: прості речі. Посилання на дату. Регулююче право. Стандартна мова. Валідаційні моделі майже одразу його підхопили. Формувався кворум швидко. Стейк був закріплений. Свідоцтво видане. Хеш вихідних даних зафіксований.

Готово.

Друге положення на перший погляд схоже. Той самий набір контрактів. Але це мало виключення з індемніфікацією з умовною мовою. Такий тип мови, що змінює значення залежно від того, як його читаєш. Або залежно від юрисдикції, про яку йдеться.

Це не так швидко проходило.

Ви фактично могли бачити, як формуються думки валідаторів. Різні моделі. Різні запуски тренувань. Кожна незалежно оцінювала одне й те саме твердження.

Деякі схилялися до одного. Деякі — до іншого.

Вага кворуму зросла.
Пауза.
Знову зросла.

Зрештою вона перетнула поріг. Свідоцтво надруковане. Перевірка пройдена.

Але ще одне виділилося: вага незгоди.

Хоча твердження пройшло, розбіжність була вищою, ніж у перше положення. Це число залишалося видимим.

У старій системі такого б не було. Модель давала відповідь з упевненим тоном. Все виглядало однаково впевнено. Ви ніколи б не дізналися, що можливо кілька обґрунтованих інтерпретацій.

Тут твердження все ще проходить. Але видно, наскільки чистою була згоди.

Я провів ще кілька перевірок.

Та сама схема кожного разу.

Чіткі фактичні твердження рухаються швидко. Консенсус формується швидко. Низька незгода. Легко.

Інтерпретаційні твердження займають більше часу. Впевненість коливається, перш ніж стабілізуватися. Іноді незгода залишається високою навіть після видачі свідоцтва.

Це стало цікавим.

Ніхто не просив цей сигнал. Початкова мета була проста: замінити «людську валідацію» на щось криптографічне.

Але коли вага незгоди з’явилася у логах, робочий процес сам собою змінився.

Рецензенти почали спершу відкривати положення з високою незгодою. Не тому, що перевірка провалилася. А тому, що система показувала, де є реальна невпевненість.

Положення з чистим консенсусом перестали автоматично отримувати другий перегляд.

Черга на перевірку зменшилася.

Не тому, що модель стала розумнішою. А тому, що невпевненість перестала бути прихованою.

Старий конвеєр все зводив до однакової впевненості у всьому. Тому люди ставилися до всього як до потенційно ризикового.

Зараз є градієнт.

Деякі положення явно міцні. Деякі — явно ні. А деякі — у сіруй зоні.

Ця сіра зона раніше була невидимою.

Mira не імітує, що розбіжності не існують. Вона їх фіксує. Свідоцтво не просто каже «так». Воно показує, наскільки сильно мережа погодилася.

І виявляється, саме це було потрібно для відповідності.

Не ще один відсотковий пункт точності.

Не більш складна модель.

Просто спосіб побачити, де модель може помилитися.

Якщо ти можеш це побачити, ти вже не переглядаєш усе однаково.

#MIRA $MIRA
MIRA2,48%
Переглянути оригінал
post-image
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 1
  • Репост
  • Поділіться
Прокоментувати
0/400
ybaservip
· 1год тому
Алмази-руки 💎
Переглянути оригіналвідповісти на0
  • Закріпити