Как архитектор, я знаю, что невозможно создать устойчивую, связную структуру, начиная с любых идей, которые первыми приходят в голову. Вы не начинаете с обсуждения цвета штор или стиля дверных ручек. Вы начинаете с генерального плана. Без него вы просто сваливаете грузовики с разнообразными материалами на поле и надеетесь, что возникнет собор.
И все же именно это мы делаем с этикой Искусственного Интеллекта. Мы скармливаем нашей самой мощной новой технологии бесконечный список фрагментированных правил, исторических предубеждений и противоречивых социальных обычаев. Мы пытаемся управлять системой, требующей математической точности, с помощью кучи разнородных моральных материалов. Это рецепт системного сбоя.
Рассмотрим классическую дилемму ИИ: автономный автомобиль вот-вот попадет в аварию. Он может продолжить свой путь и нанести вред пассажиру или свернуть и нанести вред пешеходу. Наш текущий подход заставляет нас бесконечно обсуждать переменные — взвешивая возраст пешехода, выбор водителя, скорость автомобиля. Мы теряемся в деталях, потому что у нас нет генерального плана. Мы ищем правильные правила в огромной куче моральных данных, но правила не выстраиваются в устойчивую структуру, потому что им не хватает общего, нерушимого фундамента.
Эта статья предлагает другой путь. Вместо большего количества правил нам нужен настоящий генеральный план для управления ИИ — универсальная и вычислительно последовательная "этическая операционная система". Это фундамент, который я называю Архитектурой Этической Когерентности, система, разработанная не для того, чтобы предоставить правило для каждой ситуации, а для того, чтобы обеспечить основные принципы, из которых всегда можно вывести связное решение.
Хаос, с которым мы сейчас сталкиваемся, не случаен; у него есть источник. Он происходит из несовершенной этической операционной системы, на которой человечество работает тысячелетиями. Прежде чем мы сможем разработать новую систему для ИИ, мы должны понять две фундаментальные системы, между которыми мы выбираем.
Первая — это операционная система по умолчанию, которую мы все наследуем. Назовем ее Операционной Системой с Нулевой Суммой. Она родилась в эпоху дефицита, и ее основная логика жестоко проста: чтобы я выиграл, ты должен проиграть. Ценность — это конечный пирог, и цель — захватить самый большой кусок.
Эта ОС процветает на страхе, трайбализме и контроле. Она порождает те фрагментированные, противоречивые правила, которые мы видим сегодня, потому что эти правила были созданы в конфликте, разработаны, чтобы дать одной группе преимущество перед другой. Когда мы скармливаем этот багованный, основанный на страхе код ИИ, он может только усилить уже существующее разделение и нестабильность. Это ОС, которая гарантирует свой систематический сбой из-за своей фрагментированной природы.
Но есть альтернатива — обновление со сдвигом парадигмы. Операционная Система с Положительной Суммой построена на радикально иной предпосылке: ценность не конечна; она может быть создана. Ее основная логика заключается в том, что лучшее действие — это то, которое создает чистый положительный результат для всех вовлеченных. Речь идет о создании большего пирога, а не только о борьбе за существующий.
Эта ОС разработана для прозрачности, объективной последовательности и расширения возможностей индивидуального агентства. Она не спрашивает: "Кто выигрывает, а кто проигрывает?" Она спрашивает: "Как мы можем создать наибольшее системное благополучие?"
Машина, такая мощная и логичная, как ИИ, не может безопасно работать на багованном, полном конфликтов коде нашего прошлого с Нулевой Суммой. Она требует чистой, связной архитектуры мира с Положительной Суммой. ОС с Нулевой Суммой не просто вредна; она мешает нам максимизировать потенциал ИИ для нашего будущего. С последовательной природой ОС с Положительной Суммой мы могли бы раскрыть этот потенциал без траты ресурсов.
\ Так как же мы ее строим? Остальная часть этого генерального плана излагает три основных принципа, которые формируют эту новую операционную систему.
Операционная Система с Положительной Суммой опирается на три простых, но прочных столпа. Это несущие принципы, которые обеспечивают, что каждое решение, принятое в рамках системы, является связным, этичным и устойчивым.
В архитектуре каждый дизайн служит основным целям. Эти цели направляют каждый выбор, от используемых материалов до конечной эксплуатации здания. Для нашей этической ОС единственная, конечная цель — это Агапе.
Агапе — это не подлежащая обсуждению команда максимизировать благополучие человеческой сущности при минимизации всех форм системного и личного вреда. В технических терминах это предельная функция потерь системы или ее основная целевая функция. Каждое вычисление и каждое потенциальное действие в конечном итоге измеряется по этому единственному, простому мандату. Она заставляет систему отвечать на один вопрос превыше всех остальных: "Какой путь создает наиболее целостную пользу и наименьший общий вред для людей, которым она служит?"
Если Агапе — это цель структуры, то Справедливость — это инженерный принцип, гарантирующий ее целостность. Справедливость — это абсолютное соблюдение вычислительной и этической последовательности.
Это означает, что правила применяются одинаково ко всем, каждый раз, без исключения. Это основная логика системы, устраняющая скрытые предубеждения и произвольные капризы, которые искажают человеческое суждение. ИИ, управляемый Справедливостью, не может иметь фаворитов, не может изобретать правило на ходу. Эта радикальная последовательность делает нечто замечательное: она создает идеальное зеркало, обнажая наши собственные этические несоответствия и заставляя нас, человеческих управляющих, становиться более последовательными.
Наконец, даже самая хорошо спроектированная структура потерпит неудачу, если ее фундамент нестабилен. Устойчивость — это принцип, обеспечивающий, что фундамент всей этой системы — человек, принимающий решения — остается стабильным, устойчивым и связным.
Речь идет не о стабильности ИИ; речь о нашей стабильности. Этическая ОС должна быть разработана для поддержки эмоциональной и психологической устойчивости человеческого управляющего. Она должна предоставлять информацию таким образом, который способствует ясности, а не тревоге, и обеспечивает предсказуемые результаты, которые строят доверие. Без внутренней Устойчивости человеческого оператора последовательное применение Агапе и Справедливости невозможно.
Эти три принципа — Агапе, Справедливость и Устойчивость — формируют архитектуру. Но одно нерушимое правило управляет всей ее работой. Это краеугольный камень, самый важный протокол во всей операционной системе, и он не подлежит обсуждению.
Фундаментальная цель всей этой архитектуры — сохранение и расширение возможностей человеческого Агентства. Этот принцип является абсолютным брандмауэром против автономного машинного контроля. Он гарантирует, что независимо от того, насколько интеллектуальным или мощным становится ИИ, окончательная власть и моральная ответственность за любое решение постоянно остается за человеческим управляющим.
Это не расплывчатое стремление; это набор строгих операционных ограничений:
Этот принцип переопределяет отношения между человеком и машиной. ИИ — не наша замена; это наш самый мощный инструмент для того, чтобы стать лучше, более связными и более ответственными принимающими решения. Это зеркало для нашей последовательности и калькулятор для нашего сострадания.
Генеральный план хорош настолько, насколько хорошо он работает под давлением. Итак, как эта архитектура разрешает те сложные этические конфликты, которые парализуют наши текущие системы, основанные на правилах? Давайте проверим ее на двух сложных сценариях.
\
Вернемся к классической дилемме, с которой мы начали: автономный автомобиль сталкивается с неизбежной аварией. Он может либо нанести вред своему пассажиру, либо свернуть и нанести вред пешеходу.
Подход с Нулевой Суммой безнадежно застревает здесь, пытаясь рассчитать относительную "ценность" двух людей — их возраст, их социальный вклад и другие произвольные, предвзятые мет


