Съобщението на Зукърбърг за изкуствения интелект повдига червени флагове за поверителност и токсичност

Асен Икономов
6.02.2024 г.
време за четене: 2 мин.

Съобщението на главния изпълнителен директор на Meta Марк Зукърбърг за изкуствения интелект предизвика сериозни опасения, след като той заяви, че компанията разполага с повече потребителски данни, отколкото са били използвани за обучението на ChatGPT, и скоро ще ги използва за обучение на собствените си системи за изкуствен интелект.

Планът на компанията да използва постове и коментари във Facebook и Instagram за обучение на конкурентен чатбот поражда опасения както за неприкосновеността на личния живот, така и за токсичността ...

Зукърбърг обяви плана на компанията, след като публикува последния отчет за приходите на компанията.

За много хора Фейсбук е интернет, а броят на потребителите му продължава да расте, според последните финансови резултати на Meta Platforms Inc. Но Марк Зукърбърг не просто празнува този продължаващ растеж. Той иска да се възползва от него, като използва данните от Facebook и Instagram за създаване на мощен изкуствен интелект с общо предназначение, който да [...]

[Зукърбърг каза] "Следващата ключова част от нашия наръчник е ученето от уникални данни и обратна връзка в нашите продукти... Във Facebook и Instagram има стотици милиарди публично споделени изображения и десетки милиарди публични видеоклипове, които според нашите оценки са повече от набора данни на Common Crawl, а хората споделят и голям брой публични текстови публикации в коментари в нашите услуги."

Common Crawl се отнася до огромен архив от 250 милиарда уебстраници, който представлява по-голямата част от текста, използван за обучение на ChatGPT. Като се позове на още по-голям набор от данни, Meta може да бъде в състояние да изгради по-интелигентен чатбот.

Купчината данни, върху която седи, е особено ценна, защото голяма част от тях идват от теми за коментари. Всеки текст, който представлява човешки диалог, е от решаващо значение за обучението на т.нар. разговорни агенти, поради което OpenAI усилено експлоатира интернет форума Reddit Inc. за създаването на свой собствен популярен чатбот.

Но в статията се посочват и двата големи червени флага тук. Първо, Meta на практика ще обучава своя изкуствен интелект на базата на публикации, които може да са доста лични, и на разговори между приятели в коментари във Facebook. Това поражда сериозни опасения за неприкосновеността на личния живот.

Второ, всеки, който някога е чел коментарите в интернет, знае, че процентът на токсичното съдържание е висок. Докато внимателните потребители обсъждат въпроси, не липсват и коментатори, които прибягват до лични нападки и груби обиди - и тревожна част от тях са расистки и сексистки.

Това е нещо, което всяка система за обучение на чатботове трябва да филтрира - и Apple вероятно е по-предпазлива от всички останали в собствената си работа по разработване на чатботове, което допринесе за много късното възобновяване на Siri - но ситуацията тук може да е особено лоша.

Част от съдържанието във Facebook, което се маркира като токсично, вече не се преглежда от човек и остава на сайта. Още по-лошо: когато Зукърбърг каза, че данните на Meta са по-големи от тези на Common Crawl, той вероятно е включвал историческия архив на компанията, който би включвал цялото хиперболично политическо съдържание и фалшиви новини, които са били на сайта, преди Зукърбърг да се погрижи да ги изчисти.

А това е компанията, която дори преди няколко дни заяви, че фалшив видеоклип на президента Байдън трябва да бъде оставен в платформата, защото е редактиран от човек, а не от система с изкуствен интелект, така че стандартите ѝ не са съвсем високи дори днес.

Съобщението на Зукърбърг за изкуствения интелект повдига червени флагове за поверителност и токсичност

Последни публикации

Коментари