bannerbannerbanner
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google

Робин Ли
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google

Критерии измерения искусственного интеллекта

Появление каждой новой технологии в истории человечества неизбежно будет сопровождаться размышлениями, дискуссиями и противоречиями. Перед лицом подъема искусственного интеллекта с революционными и глобальными изменениями в сфере технологий волнение, вопросы и проблемы крайне разнообразны. Некоторые из них более эмоциональны. Например, обсуждают, может ли искусственный интеллект заменить человека. Речь идет о сравнении искусственного интеллекта с природным (Natural Intelligence).

По вопросу природного интеллекта существуют различные исследования и труды, в том числе и те, которые предполагают, что механизм человеческого мозга опирается на квантовые вычисления. Для искусственного интеллекта нет четкого определения, которое бы не вызывало споров. На данном этапе развития ИИ нет необходимости усердствовать над критериями оценки. Мы могли бы обсудить это прагматично: какие интеллектуальные системы теперь могут позволить нам сделать технологии.

Существует два типа вычислительных систем, которые люди называют искусственным интеллектом.

Первый эквивалентен подсистеме «интеллектуальных вычислительных систем» (ICS). Он использует информацию в качестве входных данных и на ее основе моделирует явления, которые нас интересуют. Мы называем этот тип системы ИИ «универсальной интеллектуальной системой» (General AI). Название говорит о том, что машина обладает способностью получать знания и достигать поставленных целей.

Второй – это машины с когнитивными способностями, которые подобны человеческим. Машины могут «видеть», «слушать», «чувствовать», могут все больше рассуждать и планировать, могут двигаться благодаря сенсорному управлению движения. Мы называем этот тип системы искусственного интеллекта «когнитивной интеллектуальной системой» (когнитивный AI). Это машина со способностями восприятия, рассуждения, планирования и сенсорным управлением движения.

К другой классификации системы искусственного интеллекта относятся «узкий ИИ» и «Общий AI». «Общий AI» – это система, которая использует один и тот же алгоритм для решения большого класса задач. Система «обобщенного ИИ» может быть изучена и адаптирована для решения новых задач без вмешательства человека. Система «узкий AI» использует определенный алгоритм для решения конкретных задач, таких как игра в шахматы, создание карт и т. д.

Таблица 2-1 представляет собой обзор состояния системы искусственного интеллекта. И может служить жизнеспособным определением.

Таблица 2-1


Интеллектуальные вычислительные системы напрямую связаны с большими данными. Любые данные имеют критерии, по которым они генерируются. В основе данных лежит знание.

Основная компетенция универсальной системы искусственного интеллекта заключается в извлечении знаний из данных с помощью алгоритмов и вычислительных систем. После того, как мы получим знания, мы можем сделать множество вещей. Мы можем предсказывать явления и события, можем решить проблему автоматизации, можем решить любую проблему, которая нуждается в решении. Знание говорит нам, чего хотят люди, чего требует общество. Со знанием мы можем найти ответ. Таким образом, первый уровень развития искусственного интеллекта – общий искусственный интеллект.

Прорыв в глубоком обучении, достигнутый в последние годы, касается уровня восприятия. В частности, распознавания изображений и речи, а также понимания естественного языка. Но это только начало. Следующее, что нужно сделать, это добавить познавательную функцию. Система должна научиться познавать окружающий мир через свет, вибрацию звука или язык общения и символы.[5] Самое главное – понять, что это значит. Система видит перед собой картину и может определить, какие объекты или люди в ней находятся и что делают.

В настоящее время почти все компании, которые занимаются разработкой ИИ, могут быть размещены в четырех квадрантах. Большинство компаний создают «узкий AI», который решает только одну проблему или несколько относительно узких: играть в карты или открыть автомобиль. «Общий ИИ» использует одну и ту же систему, для решения всех проблем. И это уже похоже на человеческий интеллект. «Общий ИИ» – это долгосрочная цель развития искусственного интеллекта, достижение которой займет не менее двадцати-тридцати лет. Baidu, Google, Microsoft, Facebook и другие компании работают в направлении «общего AI». И они способны судить, может ли человек с помощью искусственного интеллекта знать больше, делать больше, испытывать больше. Например, компания Baidu, опираясь на данные поисковых систем, провела большое количество технических исследований, прежде чем создать практически невозможное – продукт, который опирается на мнения людей. Мы нашли множество беспрецедентных знаний и сделали множество выводов. Благодаря этому сейчас люди знают больше. Но мы не остановились и продолжаем двигаться вперед, чтобы добиться более невозможного. Беспилотные технологии управления, технологии взаимодействия на естественном языке, сенсорные методы движения постоянно совершенствуются. Сейчас люди используют глаза, чтобы видеть, и уши, чтобы слышать. Но, возможно, в будущем нам не понадобятся ни глаза, ни уши, потому что у нас появится более совершенный способ восприятия реальности.

Таким образом, все компании в сфере ИИ можно оценить по нескольким вопросам: Какой из четырех квадрантов занимает компания? Есть ли у нее силы и средства, чтобы люди с машинами знали больше, делали больше, испытывали больше?

В США и Китае существует множество компаний, которые утверждают, что они занимаются развитием искусственного интеллекта. Некоторые из них говорят, что ИИ – это облачные вычисления. Другие, что ИИ – это большие данные. Но это лишь часть системы искусственного интеллекта. Сила искусственного интеллекта – это массивы данных, облачные вычисления, алгоритмы, время обучения и общая мощность, а также программное и аппаратное обеспечение.

Такую силу невозможно собрать в одночасье. И не имеет смысла обобщать. На Земле нет одной дороги. Есть разные пути. Есть разные сайты, люди, бизнесы. Кто-то из них только начал движение, а кто-то оставил за спиной уже внушительную часть пути.

Baidu Brain можно рассматривать как типичную силу искусственного интеллекта. Его способность к разделению может подчеркнуть нашу состоятельность в индустрии искусственного интеллекта. Если у компании, специализирующейся на продуктах с ИИ, нет возможностей в будущем, можно сказать, что она не готова войти в эту сферу.

Baidu Brain – это сочетание аппаратной базы, базы данных и алгоритмических возможностей, облачных вычислений, больших данных и искусственного интеллекта. Это сочетание является основой стратегии Baidu. Облачные вычисления – это инфраструктура. Массивы данных – это топливо. Искусственный интеллект – это двигатель, объединяющий «физику интернета», интернет-технологии и бизнес-модели цифрового мира. Он входит в общество, чтобы полностью его изменить.

Облачные вычисления, имя в облаке – это нижняя составляющая мозга Baidu, физическая его часть IaaS (Infrastructure as a Service, инфраструктурные услуги).

Супервычислительная мощность Baidu Brain достигается за счет высокопроизводительного вычислительного оборудования. Оно составляет сотни тысяч серверов и использует передовые кластерные операционные системы для унифицированного управления суперкомпьютерами ИИ.

Для того, чтобы расширить возможности обучения, Baidu самостоятельно разработал GPU и FPGA (Программируемая пользователем вентильная матрица) гетерогенный вычислительный сервер. Он был увеличен до 64 GPU / FPGA и превосходит традиционную плотность сервера в 16 раз. Один сервер теперь может завершить обучение 100 миллиардов моделей данных. В основе Baidu FPGA находится процессор, обеспечивающий 10 Tops[6] вычислительной производительности. Он превосходит основной 20-ядерный сервер по вычислительной эффективности в 60 раз.

Но преимущество Baidu не только в одной машине, но и в отличной системе, отличной индивидуальной интеграции. Это формирует широкий спектр возможностей. Интеллектуальное планирование и система управления ресурсами для кластеров GPU позволяют осуществлять управление и динамическое планирование вычислительных, сетевых пулов, а также ресурсов хранения, вычислять общую эффективность и среднее использование кластера на 80 %. Гетерогенное оборудование для онлайн-продуктов, уменьшающее задержки запросов пользователей в 5 раз, повышает эффективность вычислений в десятки раз.

Система представляет собой самый большой кластер GPU/FPGA в Китае, самый большой кластер HADOOP/SPARK – новая одновременная и самая эффективная технология обработки данных (новые вычислительные технологии, серверные технологии, технология доступа 100G RDMA (дистанционная мгновенная технология доступа к данным) и технология O&M). Она обеспечивает вычислительную мощность, необходимую для развития искусственного интеллекта.

 

Топлива тоже достаточно. За годы работы в сфере ИИ компания Baidu собрала большое количество данных: триллион данных по страницам, миллиарды данных поисковой системы, 10 миллиардов видео, 10 миллиардов изображений и аудиоданных. Данные – это топливо для алгоритмов искусственного интеллекта. Это одно из основных условий развития искусственного интеллекта.

Оборудование в сочетании с топливом является отличным алгоритмом и моделью развития. Baidu собрал команду ведущих мировых ученых и инженеров, специализирующихся на теории и практике непрерывных инноваций, построил крупнейшую в мире глубокую нейронную сеть, поддерживающую триллионы параметров, сотни миллиардов образцов, сотни миллиардов характеристик обучения. Глубина нейронной сети значительно превысила 100 слоев.

Аппаратные мощности, топливо из данных и душа, алгоритм, позволили создать Baidu PaaS (Platform as a Service). Отличительной особенностью Baidu PaaS является то, что ИИ – горизонтальный сервис для всей платформы. Глубокое обучение, технологии машинного обучения в сочетании с мощными вычислениями, массивные данные и отличные алгоритмы, голос, изображения, обработка естественного языка и другие аспекты создают уникальные возможности для разработки карт знаний, портретов пользователей и бизнес-логики. Кроме того, они полностью открыты для пользователей. Пользователи могут легко использовать различные модули алгоритма, инструменты разработки, данные для своих собственных бизнес-целей. Мы используем различные платформы для разных целей: Tianji – для интеллектуальных массивов данных, Tianxiang – интеллектуальных мультимедиа, Tiangong – интеллектуальных вещей. Так, у нас есть возможность оказывать услуги во всех трех областях.

На верхнем уровне SaaS (Software as a Service) искусственный интеллект Baidu используется для принятия вертикальных решений, проникающих во все отрасли. Мы стремимся работать с нашими партнерами над созданием интеллектуальной индустриальной экосистемы, куда войдут образовательное облако, финансовое облако, транспортное облако, логистическое облако и т. д. Мы считаем, что способность строить экологию интеллектуальной промышленности – важный критерий для определения ценности искусственного интеллекта.

В аппаратных мощностях, данных и алгоритмах есть один важный пункт – культура искусственного интеллекта, или «мягкая сила». Технология поиска стала пионером в сфере искусственного интеллекта и первым интернет-порталом цифрового мира. Процесс разработки и технологическое ядро поисковой системы заложили основу для будущего ИИ. Поисковые системы, во-первых, должны были иметь дело с очень большими объемами данных. Во-вторых, должны были обладать функциями глубокого обучения. Операции невозможно совершать вручную, так как объем данных был и остается слишком велик. И, наконец, ключевой момент. Процесс разработки поисковых систем согласуется с развитием систем искусственного интеллекта, в основном с данными, которые представляют ценность для пользователя. Отношения сотрудничества, деловые возможности и рабочие привычки, массивы данных и накопление корпоративной культуры людей из бизнеса поисковых систем очень схожи с бизнесом ИИ. Так Лу Цзи всегда начинал обучать новичков с Bing. Справился там, справишься и в любом другом секторе. В поиске используются очень простые методы. Конечно, культура еще не идеальна. Но она, как и нейронные сети, может развиваться и совершенствоваться при правильном подходе.

Искусственный интеллект + мир

Раньше люди активно обсуждали плюсы интернета. А теперь переключились на плюсы искусственного интеллекта в бизнесе, промышленности, здравоохранении, образовании и так далее. С точки зрения «знай больше, делай больше, испытывай больше», ИИ для мира будущего является фундаментальным явлением. Так появился вопрос – «искусственный интеллект + мир».

Во-первых, интеллектуальная революция может иметь далеко идущие последствия для повседневной жизни каждого человека. Самый простой пример – благодаря новаторским разработкам в области искусственного интеллекта, калькулятор и человек смогут разговаривать на одном языке.

Предыдущие взаимодействия человека и машины происходили через мышь и клавиатуру. Развитие Майкрософт позволило усовершенствовать способ коммуникации. Сегодня мы общаемся через мышь, клавиатуру и GUI (графический интерфейс пользователя), что называется рациональным взаимодействием человека и компьютера. Самый большой вклад компании Apple и Стива Джобса в развитие IT-технологий – это новый способ общения с машинами с помощью пальцев, который изменил мир. В эру искусственного интеллекта мир постоянно меняется. Теперь люди могут общаться с любым устройством на естественном языке.

Естественный язык является наиболее эффективной и универсальной формой общения. Общение между людьми – это язык, самый естественный и широко используемый. Реализация взаимодействия между человеком и компьютером на естественном языке означает, что людям не нужно будет разбираться в принципах работы каждого приложения и устройства, чтобы узнать, как им пользоваться. В будущем мы сможем общаться с автомобилями и домами напрямую.

Мы уже видели зачатки этого интеллектуального взаимодействия. Например, постепенно появляются некоторые интеллектуальные вспомогательные системы. В Соединенных Штатах люди с помощью Amazon превращают дом в умную систему. В Китае команда Baidu тоже провела много исследований в этой области. У нас есть возможность полностью изменить повседневный процесс взаимодействия людей друг с другом.

Наконец, искусственный интеллект станет двигателем новой промышленной революции. Многие люди задумываются о новой версии промышленного производства 4.0. Вступит ли мир в следующий этап цифрового общества? Интеллектуальные системы будут иметь возможность черпать данные из реальной жизни, перемещаться по знаниям. Этим они помогут людям воспринимать и познавать реальный мир. И внедрять изменения в экономические, социальные, культурные и другие аспекты жизни. Нам повезло жить в увлекательной эре, очень похожей на раннюю промышленную революцию. Но искусственный интеллект имеет гораздо большее влияние на общество.

Традиционная обрабатывающая промышленность (оборудование, электроприборы и электроэнергетика, производственные линии) использует очень крупные инвестиции для создания продукта, изменение которого вызывает известные сложности. Например, чтобы создать производственную линию автомобилей, потребуется внушительное количество времени и средств. Умные данные смогут точно предсказать конец завершения преобразования обрабатывающей промышленности и создать новую модель производства. Производство будущего – модульный процесс с цифровым управлением. Если автопроизводитель захочет создать новый тип автомобиля, ему не потребуется перестраивать производственные линии. Нужно будет всего лишь изменить интерфейс (API) для нового продукта и перейти на него. Это в корне изменит производственную базу и значительно улучшит эффективность производства.

В основе этого изменения лежат данные и знания, а именно знание процесса производства. Теперь каждый шаг можно будет контролировать с помощью цифровых технологий.

Приведем пример из фармацевтической промышленности. Создание нового лекарственного препарата – это длительный процесс исследований и разработок, чтобы выявить наиболее эффективный способ для борьбы с конкретным заболеванием. В будущем с помощью вычислительных технологий искусственного интеллекта, больших генетических данных и массивного анализа информации о здоровье человека индивидуальный подбор лекарств будет осуществляться в считанные минуты.


Рис. 2-1 Стремительный рост геномных данных[7]


Искусственный интеллект не только повышает общую конкурентоспособность Китая на мировой арене, но и дает ему существенные преимущества. КНР – крупный игрок в обрабатывающей промышленности, где объем данных имеет большое значение. Это означает, что у нас есть возможность извлечь больше «знаний» и получить лучший результат, чем у других. Вы знаете больше, чем кто-либо другой. Видите больше, чем кто-либо другой. Можете сделать больше, чем кто-либо другой. Вы сильнее, чем кто-либо другой. Интеллектуальная эпоха, национальная конкуренция, промышленная конкуренция, овладение большими объемами информации может сделать тебя непобедимым. Если бы Китай воспользовался этой возможностью и завершил интеллектуальную модернизацию, другие страны не смогли бы с ним конкурировать. Но то, как достичь умного производства, требует общего стратегического анализа.

Преимущества Китая

В настоящее время США и Китай являются двумя крупнейшими странами с точки зрения искусственного интеллекта.

Люди привыкли сравнивать Baidu и Google, что также можно рассматривать как уменьшенную копию сравнения США с Китаем. Я думаю, что у обеих компаний есть много общего – происхождение, корпоративная культура. Baidu имеет преимущество в Китае, а Google – в США.

Но есть и отличия. У Baidu больше пространства для инноваций и выше их скорость, чем у Google. Это связано с национальными условиями Китая и США.

Уровень инноваций мобильного интернета в Китае на многих уровнях превзошел уровень инноваций в США.

Например, создание инновационного мобильного телефона с функциями искусственного интеллекта для поиска информации. Baidu имеет больше возможностей для инноваций, чем Google. IT-отрасли в США и Китае имеют разные модели. Baidu Financial может опираться на преимущества китайского рынка и объемы данных и, используя технологию ИИ, создать нечто революционное. В Соединенных Штатов финансовая индустрия имеет «сильные барьеры», поэтому Google попасть в финансовый сектор проблематично.

Другой пример – беспилотные автомобили. Google и Baidu пионеры в этом направлении. Сейчас Google немного обогнал Baidu. Но не факт, что это будет долго длиться. Сегодня множество китайских автопроизводителей открыты для сотрудничества с предприятиями ИИ, в частности с Baidu. Вместе у нас очень много возможностей для нововведений. И скорость таких нововведений будет значительно быстрее, чем у США. В Америке большинство автопроизводителей располагаются в Детройте, поэтому им сложно наладить коммуникацию с компаниями в сфере ИИ.

Беспилотный ли это автомобиль, финансы, здравоохранение или производство вообще, Китай и Соединенные Штаты смотрят на будущее под одним углом. Тем не менее макросреда в Китае дает умным компаниям, как Baidu, больше возможностей и пространства для действий, чем США для Google.

Итак, какую же ответственность должна взять на себя компания Baidu в условиях новой эры искусственного интеллекта?

В Соединенных Штатах система IT-индустрии, как правило, зависит от пяти компаний: Apple, Google, Facebook, Amazon, Microsoft. Компания, поддерживающая ИИ, – это не просто производственная компания. Это компания, которая управляет развитием технологий и играет роль лидера экосистемы.

В эпоху искусственного интеллекта Baidu является компанией поддержки. У нас есть такая возможность. Поэтому мы должны продолжать бороться за интеллектуальную революцию в Китае и в мире и внести свой вклад в это непростое дело.

Чтобы стать первопроходцами и основателями, мы должны позиционировать себя как «наделенные полномочиями». Baidu – это, прежде всего, китайский мозг Baidu. Интеллектуальное облако Baidu доступно для всех отраслей промышленности и для любой открывает широкие возможности для движения вперед.

Как основоположник отечественного искусственного интеллекта, Baidu имеет влияние на развитие и совершенствование во многих отраслях сферы искусственного интеллекта.

Например, здравоохранение и образование – очень большая область применения ИИ. Здесь особенно ярко наблюдается проблема недостатка данных. Знания и опыт могут быть только приобретены и накоплены. Поэтому высокую квалификацию имеют старые учителя и врачи. В будущем с помощью машин мы сможем автоматически анализировать данные, помогая тем самым врачам упростить подбор медикаментов, а учителям найти индивидуальный подход к каждому ученику. Здравоохранение станет давать людям больше здоровья, а образование – знаний. В обеих областях применение ИИ будет играть существенную роль.

 

Или беспилотные автомобили, например. Создание дронов также опирается на восприятие, познание и знание. Сегодня введение беспилотных автомобилей в эксплуатацию еще не представляется возможным и требует времени[8]. Но как только мы этого достигнем, у общества откроются огромные перспективы для трансформации. Это не просто решение транспортной проблемы. Беспилотная машина может двигаться сама по себе. И это скажется во всех отраслях промышленности.

Искусственный интеллект предоставляет нам такое количество возможностей, что реализовать их все и сразу не представляется возможным. Конечно, стратегия трансформации общества должна реализовываться шаг за шагом. Направление движения должно быть твердым, а темп устойчивым.

5За последние несколько лет нейросети научились понимать, что за объекты находятся на фотографии и как они взаимойдействуют друг с другом. Например, чашка стоит на столе, а ложка находится внутри чашки. В экспериментальных сетях достигнут и обратный эффект: по текстовому описанию нейросеть способна воссоздать изображение, например женщину, едущую на лошади по лугу. – Прим. науч. ред.
6Триллион операций в секунду – Прим. науч. ред.
7Великобритания запустила «геномную программу 100 000 человек» в 2014 году, а США и Китай объявили о завершении сбора геномных данных до 1 миллиона человек. Данные, полученные всемирно известной компанией по секвенированию генов Illumina Instruments sequencing, удваиваются каждые 12 месяцев. Это огромная «черная дыра данных», а также золотодобывающая шахта данных.
8Несмотря на возросшую активность за последние годы, даже передовые проекты с беспилотными такси не допускают перемещение авто по городу без оператора внутри, пусть и не на водительском кресле. – Прим. науч. ред.
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24 
Рейтинг@Mail.ru