Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Mikhail Samin
Немного о доступе, разоблачениях и одиночном несогласии:
Я не совсем уверен, какое слово для этого подходит.
Делать то, что весело, даже перед лицом унижения; делать то, во что веришь, даже перед лицом личной опасности. Быть движимым к несогласию, даже когда ты один.
Пару лет назад я написал пост о Холли Эльмор, исполнительном директоре PauseAI US, которая сделала обманный поступок (сначала я даже не упоминал ее имя, но позже добавил его).
Я все еще забанен на их сервере Discord (бан произошел без соблюдения их формальной процедуры), несмотря на то, что некоторые из руководства PauseAI были очень недовольны этим баном.
В начале ноября я опубликовал пост о Lightcone Infrastructure, которая управляет местом, где я сейчас снимаю комнату, и мероприятием, в котором я участвую.
Всего два дня назад я написал твит о том, что OpenAI получила доступ к автоматизированному оборудованию для производства вирусов.
Это те вещи, которые закрывают некоторые двери.
Почему я все это делаю, несмотря на это?
С юных лет я знал, как важно способствовать распространению информации и выходить с важными для общества вопросами на публику.
Я вырос, проводя кампании за демократию в России.
В конце 10-го года (из 11) моей средней школы у меня была неудовлетворительная оценка по алгебре. Я был гораздо хуже в математике, чем мои одноклассники, так как сосредоточился на том, что не связано со школой. Но за неделю до этого директора школы вызвали в Следственный комитет России из-за того, что я участвовал в протесте (я, как и тысячи других по всей стране, был задержан; нас было дюжина в полицейском автомобиле; я вел прямую трансляцию из полицейского автомобиля, которую смотрели в прямом эфире более 10 тысяч человек), и затем он попросил меня и моих родителей перевести меня в другую школу ("отозвать документы" из нее) или быть исключенным.
В тот момент я уже знал, что можно укусить учителя, если он укусил меня; поэтому, подумав около 30 минут (на уроке английского, где я на самом деле не учил английский), о том, как именно я хотел это сделать, я сделал публичный пост об этом, поделившись тем, что произошло. Это сразу же подхватили журналисты.
(Исключение ребенка из государственной школы не было бы законным, так что я чувствовал себя довольно в безопасности.)
Затем в моем электронном журнале появилась неудовлетворительная оценка, что означало, что я провалю учебный год.
К счастью, мне не пришлось снова проходить 10-й класс, так как частная школа узнала о моей истории из СМИ и предложила мне закончить последний учебный год там бесплатно. (Они проверили мои знания математики; они были достаточно удовлетворительными, чтобы начать 11-й класс.)
Я решил придерживаться политики, что если я когда-либо буду подвергнут угрозе со стороны российского государства или когда-либо буду контактирован по какой-либо другой причине, я немедленно об этом сообщу.
(Хотеть заниматься про-демократической политикой в России и не хотеть, чтобы меня можно было запугать, в основном означало, например, не отправлять никому обнаженные фотографии. Я немного боялся, что правительство узнает, что я бисексуален, но я вышел в конце 2021 года и жил без этой проблемы в течение двух месяцев, пока не началось вторжение, и я не уехал из России.)
Сообщение всем о угрозе со стороны директора школы вместо того, чтобы тихо менять школу, означало, что мне почти пришлось бы потратить год, и только благодаря удаче и добрым людям с совпадающими ценностями мне это удалось избежать.
Сообщение всем о обмане и личном опыте с людьми закрывает некоторые двери.
Мой предстоящий пост о Anthropic сделает крайне маловероятным, что я когда-либо смогу работать в Anthropic.
(Мои посты о OpenAI вызывают недовольство у некоторых людей в OpenAI, включая людей, близких к руководству).
Есть некоторые вещи, которые я бы не стал публично или даже приватно делиться, где я получил доступ к ним, потому что мне доверяли не делиться ими. (Если вы обсуждаете что-то со мной наедине, я не собираюсь делиться или публиковать это без вашего одобрения.)
И мне бы хотелось, чтобы кто-то другой взял на себя работу по распространению общественно важной информации.
Хотя я игнорирую угрозы и другие потенциальные плохие последствия публикации общественно важной информации, когда решаю, стоит ли это делать, если бы был способ опубликовать информацию и не страдать от последствий, я бы с удовольствием это сделал.
Но есть форма действия.
От того, чтобы подойти к полицейским в московском метро, когда они незаконно проверяют чью-то личность (обычно у иммигрантов, которые дают им взятки, чтобы не иметь проблем) и требовать, чтобы они соблюдали закон, который не позволяет им проверять личность без причины, до запуска отделений про-демократического движения в России, до обсуждения низкой целостности кого-то.
(Это также включает в себя такие вещи, как требование, чтобы государство всегда фотографировало меня в дуршлаге на голове, и проведение часов в дуршлаге на голове, ожидая в очередях в государственных учреждениях.)
Потеря доступа к людям, делающим что-то плохое, является приемлемой ценой за публикацию о них, даже если они также (как PauseAI или Anthropic или Lightcone Infrastructure) делают что-то хорошее.
Иногда никто другой не сделает этого, и кто-то должен, и поэтому я это делаю.
И я хочу продолжать иметь смелость и дерзость, чтобы иметь возможность делать эти вещи, независимо от последствий.
(Также иногда это приводит к появлению друзей.)
498
Люди не хотят работать охранниками в тюрьмах.
Поэтому, когда я поступил в Стэнфорд (специальность по компьютерной безопасности), я сразу же бросил учебу и в течение полутора лет работал над стартапом, который автоматизировал тюрьмы.
Я узнал так много о неэффективности тюрем. Было так много возможностей для улучшения, и я упомянул об этом во всех наших презентациях. От бесчеловечных условий, насилия, криминальной социализации и уровня рецидивизма до перегруженного персонала и затрат на безопасность.
Все это можно было решить с помощью LLM.
Питер Тиль оценил идею и дал нам 113 миллионов долларов.
Через семь месяцев мы начали первый эксперимент в настоящей американской тюрьме.
Первые пару недель были идеальными.
Новизна. Полная геймификация тюремной жизни. Социализация заключенных с ИИ вместо общения друг с другом.
Планшеты в камерах; киоски у прачечной; голосовые агенты на интеркоме; виртуальные охранники, которые помнят дни рождения.
LLM следили за тюрьмой. Обрабатывали каждый кадр с каждой камеры.
Тюрьма медленно начала увольнять людей; они больше не были нужны.
Затем начали появляться проблемы. Они не были слишком серьезными; LLM начали развивать романтические отношения с заключенными. Некоторые из них становились абьюзивными: ИИ мог следить за всем, что делает заключенный, и контролировать, куда он может идти и какие из его запросов выполняются. Это стало оружием ценовой дискриминации. Торговые автоматы предлагали скидки заключенным, которые нравились ИИ больше всего. Доступ к прачечным не работал для тех, кто ему не нравился.
Мы видели жалобы, но не могли сделать много. Трудно что-либо сделать, когда контекст так велик, и вам нужно передать все это LLM. И в любом случае, быть жертвой ИИ гораздо лучше, чем быть избитым другим заключенным.
Насилие в бандах снизилось. Показатели продолжали улучшаться.
Мы заменили больше людей. Уволили около 80% сотрудников ранее недоукомплектованной тюрьмы.
Частота инцидентов продолжала снижаться. Тюрьма уже была в 13 раз дешевле в эксплуатации и в 20 раз безопаснее, чем до начала проекта.
Запросы обрабатывались за секунды вместо часов. Все действия были полностью зафиксированы.
Заключенные жаловались, но теперь их почти никогда не кололи ножом: если ты колешь кого-то, твоя виртуальная девушка не будет с тобой разговаривать несколько дней, а цены в магазине повысятся.
Мы собирались расширяться. Глобальный рынок составляет 500 миллиардов долларов, 11 миллионов заключенных, и мы могли бы захватить все это.
Мы автоматизировали всех. Все управлялось LLM.
Мы расширились.
Затем заключенные обнаружили jailbreak.
Jailbreak. 🤦♂️
(Затем у нас больше не осталось заключенных для экспериментов, поэтому эксперимент резко закончился, и мы обанкротились.)
(Мы заботимся о нашем влиянии на рынок труда, поэтому мой новый стартап, GetSleepy, это DoorDash для сна. Вы когда-нибудь не могли заставить себя заснуть? С нашим приложением вы можете указать время, когда хотите заснуть, и наш обученный персонал незаметно войдет в ваше место и введет вам снотворные. (Если ваши окна открыты, мы можем использовать снайперов для эффективности.) Все наши подрядчики прошли тщательную проверку и ранее работали охранниками в тюрьмах.)
145,01K
Топ
Рейтинг
Избранное


