DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
2024年1月,DeepSeek发布首个670亿参数大模型DeepSeekLLM,其推理与编码能力超越同期Llama270B模型;同年5月推出的DeepSeek-V2采用混合专家(MoE)架构,性能对标GPT-4Turbo而成本仅为其1%,被业界称为“AI届拼多多”。至2025年1月,R1模型正式发布,在数学推理、代码生成等任务上达到GPT-4o同等水平,7天内用户破亿,登顶全球140国应用商店榜首,重构了AI技术的普及范式。