2025年5月24日,开源鸿蒙开发者大会2025(OHDC.2025)在深圳盛大开幕。深思考人工智能创始人兼CEO杨志明受邀在AI分论坛发表演讲,分享了深思考在技术研发、生态适配与行业应用的核心优势。
一、核心技术突破:轻量化与多模态的双重革新
杨志明博士指出,随着 AI 智能终端的爆发,端侧大模型成为解决隐私安全、实时响应和国产化适配的关键。深思考通过自研核心技术,在模型轻量化与性能表现上实现突破:
TinyDongni 端侧多模态大模型:参数规模低至 1.5B/0.4B,采用 DongniForCausalLM 架构,支持 32K 超长上下文。该模型通过多芯片协同处理与内存优化技术,在瑞芯微 RK3588 芯片上实现 13.6 tokens/s 推理速度,兼顾低功耗与高响应效率。
DeepSeek-R1 超小端侧模型:基于 DeepSeek-R1 优化的 1B 模型,通过 Dongni-v 多层次语义解码架构赋予多模态能力,实现图像与文本特征的跨模态对齐。其推理速度达 10.2 tokens/s。
超小端侧语音合成TTS模型:参数量仅0.04B,支持语音合成,为端侧交互提供完整声音解决方案。在智能家居场景下,用户发出指令后,设备能通过该模型迅速合成清晰自然的语音反馈,增强用户交互体验。
二、国产化生态适配:从操作系统到算力模组的全链条打通
深思考以“软硬一体”理念构建国产化端侧解决方案:
操作系统兼容:端侧模型已适配OpenHarmony、Linux、Windows、Android等主流系统,其中鸿蒙系统首个端侧DeepSeek-R1-1B模型已实现商用部署。
国产算力协同:与广和通、深开鸿等头部模组厂商合作,推出适配国产芯片的硬件方案。
深开鸿模组:搭载瑞芯微RK3588芯片与OpenHarmony系统,支持8K影像处理与多屏交互,适用于工业检测、AI摄像头等高精度场景。
广和通模组:集成高通QCS8550芯片与48TOPSAI引擎,为车载、机器人提供实时多模态AI处理能力。
三、行业落地案例:从医疗到智能终端的多元化场景
端侧大模型技术已在多个关键领域实现生态应用落地,覆盖智能终端与智慧医疗两大场景,包括医疗器械(显微镜、内窥镜等)、手机相册、个人文件存储、家庭NAS、保密安全PC、汽车、手表、智能家居、AI萌宠、机器人等细分领域:
AIPC:深思考基于自研的TinyDongni端侧AI多模态大模型,在AI PC领域实现了本地离线运行的智能化突破。AI PC Suite套件通过深度语义理解技术,支持用户以自然语言模糊搜索本地文件、图片及视频,同时集成问答、PPT智能生成、文档翻译等AI办公全场景功能。显著降低个人、企业的办公成本,重塑高效安全的本地化办公流程。
AI手机:端侧 AI 多模态大模型深度赋能智能相册功能,大模型自动理解、分析手机相册中的图片内容,实现人像、事物、科幻、剧情、植物、夜景等50+种精细化分类。帮助用户秒级管理海量影像,隐私无忧享受个性化数字记忆库。
AI存储:依托多模态大模型的文本、语义、图像理解能力,在存储硬盘等本地存储场景中实现文件、图片、视频多维度索引构建与智能检索服务。激活冷数据价值,为个人、企业提供合规高效的数据资产搜索引擎。
四、端云协同战略:构建安全可控的AI生态
深思考以“端、边、云三侧联动”为核心战略,在隐私敏感场景(如医疗、保密办公)聚焦超小尺寸端侧大模型的部署,同时通过云端多模态大模型提供技术服务补充。杨志明强调:“我们的技术始终围绕市场刚需,以‘垂域化、场景化、产品化、服务化’四化为目标,让AI真正规模化落地。”