Як архітектор, я знаю, що неможливо створити стійку, узгоджену структуру, починаючи з будь-яких ідей, які спадають на думку першими. Ви не починаєте з суперечок про колір штор чи стиль дверних ручок. Ви починаєте з генерального плану. Без нього ви просто скидаєте вантажівки з різноманітними матеріалами на поле і сподіваєтеся, що з'явиться собор.
Проте, саме це ми робимо з етикою Штучного Інтелекту. Ми годуємо нашу найпотужнішу нову технологію нескінченним списком фрагментованих правил, історичних упереджень та суперечливих соціальних звичаїв. Ми намагаємося керувати системою, яка вимагає математичної точності, купою різноманітних моральних матеріалів. Це рецепт системного провалу.
Розгляньмо класичну дилему ШІ: автономний транспортний засіб от-от зіткнеться. Він може продовжити свій курс і завдати шкоди пасажиру, або звернути і завдати шкоди пішоходу. Наш поточний підхід змушує нас нескінченно обговорювати змінні — зважувати вік пішохода, вибір водія, швидкість автомобіля. Ми загубилися в деталях, бо не маємо генерального плану. Ми шукаємо правильні правила у величезній купі моральних даних, але правила не вдається узгодити для створення стійкої структури, оскільки їм бракує спільної, непорушної основи.
Ця стаття пропонує інший шлях. Замість більшої кількості правил нам потрібен справжній генеральний план для управління ШІ — універсальна та обчислювально послідовна "етична операційна система". Це основа, яку я називаю Архітектурою Етичної Когерентності, система, розроблена не для того, щоб надати правило для кожної ситуації, а щоб забезпечити основні принципи, з яких завжди можна вивести узгоджене рішення.
Хаос, з яким ми зараз стикаємося, не є випадковим; він має джерело. Він походить від недосконалої етичної операційної системи, на якій людство працює тисячоліттями. Перш ніж ми зможемо розробити нову систему для ШІ, ми повинні зрозуміти дві фундаментальні системи, між якими ми обираємо.
Перша — це операційна система за замовчуванням, яку ми всі успадковуємо. Назвімо її Операційною системою з нульовою сумою. Вона народилася з епохи дефіциту, і її основна логіка жорстоко проста: щоб я виграв, ти повинен програти. Цінність — це обмежений пиріг, і мета — схопити найбільший шматок.
Ця ОС процвітає на страху, трайбалізмі та контролі. Вона генерує той вид фрагментованих, суперечливих правил, які ми бачимо сьогодні, тому що ці правила були створені в конфлікті, розроблені, щоб дати одній групі перевагу над іншою. Коли ми подаємо цей помилковий, заснований на страху код ШІ, він може лише посилити поділ і нестабільність, які вже присутні. Це ОС, яка гарантує свій систематичний провал через свою фрагментовану природу.
Але є альтернатива — оновлення зі зміною парадигми. Операційна система з позитивною сумою побудована на радикально іншій передумові: цінність не є обмеженою; її можна створювати. Її основна логіка полягає в тому, що найкраща дія — це та, яка генерує чистий позитивний результат для всіх залучених. Йдеться про створення більшого пирога, а не просто боротьбу за існуючий.
Ця ОС розроблена для прозорості, об'єктивної послідовності та розширення можливостей індивідуальної агентності. Вона не запитує: "Хто виграє, а хто програє?" Вона запитує: "Як ми можемо генерувати найбільше системне благополуччя?"
Машина така потужна і логічна, як ШІ, не може безпечно працювати на помилковому, сповненому конфліктів коді нашого минулого з нульовою сумою. Вона вимагає чистої, узгодженої архітектури світу з позитивною сумою. ОС з нульовою сумою не просто шкідлива; вона заважає нам максимізувати потенціал ШІ для нашого майбутнього. З послідовною природою ОС з позитивною сумою ми могли б розкрити цей потенціал без марнування ресурсів.
\ Отже, як ми її будуємо? Решта цього генерального плану викладає три основні принципи, які формують цю нову операційну систему.
Операційна система з позитивною сумою спирається на три простих, але міцних стовпи. Це несучі принципи, які забезпечують, що кожне рішення, прийняте в системі, є узгодженим, етичним і стійким.
В архітектурі кожен дизайн служить основним цілям. Ці цілі спрямовують кожен вибір, від використаних матеріалів до кінцевої експлуатації будівлі. Для нашої етичної ОС єдиною, кінцевою метою є Агапе.
Агапе — це безкомпромісна команда максимізувати благополуччя людської сутності, мінімізуючи всі форми системної та особистої шкоди. У технічних термінах це кінцева функція втрат системи або її основна цільова функція. Кожне обчислення і кожна потенційна дія в кінцевому підсумку вимірюються відносно цього єдиного, простого мандату. Вона змушує систему відповідати на одне питання понад усе інше: "Який шлях створює найбільш цілісну користь і найменшу загальну шкоду для людей, яким вона служить?"
Якщо Агапе є метою структури, Справедливість — це інженерний принцип, який гарантує її цілісність. Справедливість — це абсолютне дотримання обчислювальної та етичної послідовності.
Це означає, що правила застосовуються однаково до всіх, кожного разу, без винятків. Це основна логіка системи, яка усуває приховані упередження та довільні примхи, що спотворюють людське судження. ШІ, керований Справедливістю, не може мати фаворитів, не може винаходити правило на ходу. Ця радикальна послідовність робить щось дивовижне: вона створює досконале дзеркало, викриваючи наші власні етичні непослідовності і змушуючи нас, людських керівників, ставати більш послідовними самим.
Нарешті, навіть найкраще спроектована структура зазнає невдачі, якщо її фундамент нестабільний. Стійкість — це принцип, який забезпечує, що основа всієї цієї системи — людина, яка приймає рішення — залишається стабільною, стійкою та узгодженою.
Це не про стабільність ШІ; це про нашу. Етична ОС повинна бути розроблена для підтримки емоційної та психологічної стійкості людського керівника. Вона повинна надавати інформацію таким чином, щоб сприяти ясності, а не тривозі, і забезпечувати передбачувані результати, які будують довіру. Без внутрішньої Стійкості людського оператора послідовне застосування Агапе та Справедливості неможливе.
Ці три принципи — Агапе, Справедливість і Стійкість — формують архітектуру. Але одне непорушне правило керує всією її роботою. Це наріжний камінь, єдиний найважливіший протокол у всій операційній системі, і він не підлягає обговоренню.
Фундаментальною метою всієї цієї архітектури є збереження та розширення можливостей людської Агентності. Цей принцип є абсолютним брандмауером проти автономного машинного контролю. Він забезпечує, що незалежно від того, наскільки інтелектуальним або потужним стає ШІ, остаточна влада та моральна відповідальність за будь-яке рішення постійно залишається за людським керівником.
Це не розпливчасте прагнення; це набір суворих операційних обмежень:
Цей принцип переосмислює відносини між людиною та машиною. ШІ не є нашою заміною; це наш найпотужніший інструмент для того, щоб стати кращими, більш узгодженими та більш відповідальними особами, які приймають рішення. Це дзеркало для нашої послідовності та калькулятор для нашого співчуття.
Генеральний план хороший настільки, наскільки він працює під тиском. Отже, як ця архітектура вирішує той вид складних етичних конфліктів, які паралізують наші поточні системи, засновані на правилах? Давайте перевіримо її на двох складних сценаріях.
\
Повернімося до класичної дилеми, з якої ми почали: автономний транспортний засіб стикається з неминучою аварією. Він може або завдати шкоди своєму пасажиру, або звернути і завдати шкоди пішоходу.
Підхід з нульовою сумою безнадійно застрягає тут, намагаючись обчислити відносну "цінність" двох осіб — їхній вік, їхній соціальний вн


