Что такое DeepSeek и что прорывного в этой нейросети. Объясняем простыми словами

DeepSeek — семейство нейросетей от одноимённой китайской компании. В январе 2025 года разработчики представили версию DeepSeek-R1, способную не только давать ответы на письменные запросы пользователей, но и показывать ход размышления. Нейросеть получилась не хуже ведущих мировых аналогов, при этом оказалась в десятки раз дешевле в создании.

Фев 2, 2025 - 21:24
 0
Что такое DeepSeek и что прорывного в этой нейросети. Объясняем простыми словами

DeepSeek — семейство нейросетей от одноимённой китайской компании. В январе 2025 года разработчики представили версию DeepSeek-R1, способную не только давать ответы на письменные запросы пользователей, но и показывать ход размышления. Нейросеть получилась не хуже ведущих мировых аналогов, при этом оказалась в десятки раз дешевле в создании.

Проще говоря, это как ChatGPT, GigaChat, YandexGPT и другие уже привычные нейросети, только made in China.

DeepSeek взорвала мир: за сутки 27 января 2025 года она стала самым скачиваемым приложением в американском App Store и обрушила акции нескольких технологических гигантов. Потому что показала, что сильные языковые модели* можно сделать без многомиллиардных инвестиций.

* Модель и нейросеть — это одно и то же?

Оба термина используют в качестве синонимов. Но они не равны друг другу.

Модель — это более широкое понятие, которое включает в себя любой алгоритм машинного обучения.

Нейросеть (нейронная сеть) — специфическая архитектура, вдохновлённая структурой биологического мозга, один из многих возможных подходов к машинному обучению.

Получается, что любая нейросеть является моделью, но не любая модель является нейросетью. Это отношение «часть — целое» , где нейросеть — частный случай модели.

С английского deep seek переводится как «глубокий взгляд».

Нейросеть выглядит как чат-бот и доступна пользователям всего мира бесплатно.

Штаб-квартира компании DeepSeek в Пекине
Артем Иванов/ТАСС

Что умеет DeepSeek

Спектр задач нейросети в целом не отличается от набора функций у конкурентов. DeepSeek умеет: - отвечать на вопросы; - генерировать тексты разных объёмов и жанров; - переводить тексты; - создавать креативные идеи: названия, сюжеты, дизайн-концепции; - искать информацию в интернете; - считать математические уравнения; - ставить предварительный диагноз по симптомам (с этим аккуратнее, лучше обратиться к врачу); - расшифровывать диаграммы и объяснять картинки; - писать код, корректно форматировать его и решать сложные задачи по программированию на различных языках, например C++, Go, Java, JavaScript, Python и Rust.

По состоянию на февраль 2025 года актуальные версии нейросети — DeepSeek-V3 и DeepSeek-R1.

V3 отличается от предшественников (V1 и V2) высокой производительностью и способностью помнить контекст беседы объёмом примерно 250–300 страниц текста на листах А4.

R1 — усовершенствованная версия V3. Модель отличается тем, что вместо стандартной генерации ответов имитирует человеческое мышление, последовательно анализируя данные и аргументируя выводы.

Как пользоваться DeepSeek

DeepSeek выглядит как чат-бот с окном для ввода текстовых сообщений.

Чтобы начать пользоваться DeepSeek, нужно зайти на сайт deepseek.com и зарегистрироваться. В отличие от западных нейросетей, китайское решение доступно жителям России без всяких препон.

Также можно скачать приложение, оно доступно в App Store и Google Play.

После регистрации появится окно с чат-ботом, куда можно отправить текстовый запрос. Нейросеть DeepSeek-V3 выдаст ответ в течение 5–20 секунд.

Егор Алеев/ТАСС

Также можно выбрать опцию DeepThink для запуска цепочки рассуждений. Для этого нужно нажать кнопку DeepThink R1, она находится слева внизу. После этого вы сможете задать вопрос нейросети и следить, как она анализирует ваш запрос и размышляет над ответом. И уже после этого вы получите развёрнутый ответ.

Ответ с размышлениями нейросеть выдаёт в среднем за 30–60 секунд. Зато можно наглядно проследить за тем, как работает мыслительный алгоритм, как «думает» нейросеть.

Также можно выбрать опцию Search («поиск»), чтобы искать данные в интернете. Она находится правее кнопки R1.

Еще к запросу можно прикрепить до 50 файлов разного формата размером до 100 МБ каждый. Например, собрать несколько текстовых документов и попросить нейросеть на их основе написать статью, обозначить тезисы или выделить ключевые идеи.

Сильные стороны DeepSeek | Преимущества | Описание | | --- | --- | | Стоимость разработки | Бюджет обучения DeepSeek составил $5,58 млн, что в разы меньше его аналогов. Обычно инвестиции в сфере ИИ исчисляются сотнями миллионов долларов. Для сравнения: компания OpenAI потратила на обучение ChatGPT свыше $100 млн. | | Доступность | Чат-бот бесплатен для всех пользователей. В то же время, например, ChatGPT имеет ряд ограничений. Без подписки чат-бот работает на ослабленной ИИ-модели GPT 4o. За более «умную» модель нужно платить. | | Отсутствие ограничений | При запуске DeepSeek-R1 пользователям поначалу было доступно только 50 бесплатных запросов в день. Однако сейчас нейросеть стала полностью бесплатной для каждого, у неё нет никаких ограничений. | | Открытый код | Большой плюс DeepSeek — это полностью открытый исходный код, который позволяет разработчикам использовать технологию для своих коммерческих целей, а также адаптировать её для решения различных задач в сфере искусственного интеллекта. |

Реакция на успех DeepSeek

Выход DeepSeek R1 спровоцировал панику на фондовом рынке. Сразу после открытия торгов 27 января началась массовая распродажа акций технологических компаний. Выпуск новой нейронки стоил американскому фондовому рынку более чем $1,3 трлн. DeepSeek — как первый спутник в космосе. Что говорят в мире о китайском чат-боте, уронившем западный рынок

Акции Nvidia, лидера на рынке вычислительных чипов для обучения нейросетей, упали в тот день на 17,8%. Компания подешевела больше чем на $600 млрд за день (58 трлн рублей — в полтора раза больше бюджета России).

С июня 2024 года Nvidia считалась самой дорогой компанией мира. Теперь её обогнали Microsoft и Apple. Генеральный директор Nvidia Дженсен Хуанг потерял $20 млрд — это 20% его состояния.

Последний раз что-то похожее было в начале пандемии коронавируса.

Ценные бумаги других крупных игроков с многомиллиардными расходами на ИИ также просели: Microsoft — на 2,4%, Alphabet — на 4,2%.

Аналитики объясняют столь бурную реакцию рынка тем, что инвесторы поняли две вещи. Во-первых, у американского бигтеха появился мощный конкурент в области искусственного интеллекта. А во-вторых, инвестиции западных компаний в этой сфере теперь кажутся завышенными и менее эффективными.

Трейдеры работают на Нью-Йоркской фондовой бирже во время утренних торгов 28 января 2025 года в Нью-Йорке
MICHAEL M. SANTIAGO / Getty AFP / East News

«DeepSeek доказала, что мощные языковые модели можно создавать даже без доступа к колоссальным вычислительным мощностям, и заставила рынок пересмотреть отношение к крупным американским компаниям: смогут ли они оправдать свои многомиллиардные затраты?» — отметил инвестбанкир и профессор ВШЭ Евгений Коган.

История компании DeepSeek

Компания DeepSeek появилась в 2023 году в Пекине. Её основателем стал Лян Вэньфэн, глава китайского хедж-фонда High-Flyer.

Вэньфэн использовал модели искусственного интеллекта для принятия инвестиционных решений, но потом решил изменить направление, чтобы сосредоточиться на разработке самого передового искусственного интеллекта.

Вэньфэн с головой окунулся в передовые системы искусственного интеллекта, основав DeepSeek и задавшись целью конкурировать с крупнейшими и богатейшими компаниями в этой области во всём мире.

Ещё в 2021 году Вэньфэн стал активно скупать графические процессоры Nvidia, необходимые для обучения нейросетей. В следующем 2022 году администрация Джо Байдена ограничила продажу некоторого модельного ряда графических процессоров Nvidia и AMD в Китай, что должно было создать больший технологический разрыв на рынке нейросетей между странами.

Но ещё до введения этих ограничений Вэньфэн успел накопить запасы мощных чипов и графических процессоров Nvidia.

Неясно, сколько High-Flyer инвестировала в DeepSeek. High-Flyer имеет офис, расположенный в том же здании, что и DeepSeek, а также владеет патентами, связанными с кластерами чипов, используемыми для обучения моделей ИИ. В 2024 году компания выпустила модели DeepSeek-V1 и DeepSeek-V2, но о них практически не говорили за пределами Китая.

В чём обвиняют DeepSeek

На фоне бешеного успеха DeepSeek конкуренты стали подозревать китайскую нейросеть в краже данных для обучения ИИ. Microsoft и OpenAI развернули внутреннее расследование в отношении китайского стартапа. Они допускают, что DeepSeek могла незаконно использовать их данные для обучения R1, писало агентство Bloomberg со ссылкой на анонимные источники.

Советник президента США по искусственному интеллекту Дэвид Сакс в интервью Fox News прямо сказал, что DeepSeek «просто "выжал" знания из моделей OpenAI».

Сама OpenAI выпустила заявление, в котором не стала упоминать DeepSeek, но явно на это намекала. В тексте говорится, что OpenAI «принимает меры по защите нашей интеллектуальной собственности» и намерена сотрудничать с правительством США для защиты своих передовых моделей «от конкурентов и противников».

Позднее в разговоре с FT представитель разработчика ChatGPT заявил, что нашёл некоторые доказательства того, что китайские конкуренты использовали дистилляции — техники, при которой одна ИИ-модель учится на основе данных другой. Однако никаких подробностей он больше говорить не стал.

AA/ABACA/Abaca/East News

DeepSeek также критикуют за цензуру по политически значимым для Китая вопросам. На острые и неудобные для компартии КНР вопросы чат-бот просто отказывается отвечать.

Другая претензия к DeepSeek возникла после того, как американская компания по кибербезопасности Wiz нашла в общем доступе базу данных с историей чатов пользователей. Если это правда, китайский стартап недостаточно заботится о конфиденциальности информации.

Другие китайские нейросети

DeepSeek не единственная нейронка в Китае. Есть и другие, которые уже вышли на новый уровень и могут составить конкуренцию американцам.

DouBao. Нейросеть появилась в августе 2023 года. Её выпустила компания ByteDance, которая известна как создатель TikTok. Нейросеть выглядит как виртуальный ассистент, который умеет поддерживать общение голосом и может распознавать эмоции. Также эта нейросеть способна создавать изображение и видео.

Hailuo AI (Minimax). Это нейросеть для создания видео из текста и фото. Видеогенератор позволяет бесплатно создавать до трёх роликов в день. Пользователи могут просто добавить изображение, и через несколько мгновений Hailuo AI создаст видеоклип с высоким разрешением 1280x720 пикселей и плавной частотой 25 кадров в секунду. Нейросеть уже смогла привлечь более $600 млн от инвесторов.

Qwen2.5. Универсальная нейросеть от Alibaba. Она умеет генерировать картинки и видео, читать файлы, писать код. Разработчик утверждает, что версия Max превосходит китайский чат-бот DeepSeek-V3 почти по всем показателям. Мощнее DeepSeek: в Китае выпустили ещё одну ИИ-модель. Что известно о Qwen 2.5-Max

Что говорят о DeepSeek

Президент США Дональд Трамп: «Выпуск DeepSeek — ИИ от китайской компании — должен стать тревожным сигналом для наших отраслей, о том, что нам нужно предельно сосредоточиться на конкуренции с целью победы».

Создатель Telegram Павел Дуров: «После успеха китайского стартапа DeepSeek многие удивляются тому, как быстро Китай догнал США в области искусственного интеллекта. Однако китайский прогресс в области эффективности алгоритмов возник не на пустом месте. Китайские студенты уже давно опережают других в математике и программировании на международных олимпиадах».

Глава OpenAI Cэм Альтман: «Мы, конечно, выпустим гораздо более совершенные модели, и появление нового конкурента действительно вдохновляет. Мы ускорим выход некоторых моделей».

Руководитель группы исследований и разработки технологий машинного обучения в «Лаборатории Касперского» Владислав Тушканов: «У модели от DeepSeek гораздо ярче "личность". Модель от OpenAI блестяще решает сложные задачи, но её ответы весьма сухие. Она не очень подходит, например, для креативных задач. DeepSeek же не только хорошо справляется со сложными задачами на разработку, но и отлично ведёт сложные философские дискуссии или помогает писать фантастические сценарии, при этом часто очень удачно шутит и играет со словами, то есть объединяет сильные стороны "думающих" и обычных моделей».

Американский венчурный инвестор из Кремниевой долины Марк Андрессен: «DeepSeek-R1 — один из самых удивительных и впечатляющих прорывов, которые я когда-либо видел, а в качестве открытого исходного кода — настоящий подарок миру».

Зато Илон Маск отреагировал без восторгов. Он уверен, что DeepSeek целенаправленно скрывает и занижает ресурсы, затраченные на обучение нейросети. По мнению Маска, стартап не смог бы обучить свою модель без огромного количества видеокарт Nvidia, которые находятся под санкциями в Китае.


Эта статья — одна из тысяч в «Энциклопедии "Секрета фирмы"». В этом проекте мы простыми словами рассказываем о сложных терминах и явлениях. Посмотрите другие статьи «Энциклопедии», чтобы лучше понимать мир, в котором мы живём.