
在AI应用加速渗透办公场景的当下,数据安全与落地效率正在成为企业与个人选型的核心标尺。相比于依赖云端算力的在线AI工具,端侧大模型凭借“数据不出本地、低延迟响应、适配泛终端”的天然优势,正成为办公AI的重要发展方向。
深思考人工智能长期聚焦端侧大模型的技术研发与场景打磨,依托自研的轻量化推理框架与多模态理解能力,已在本地资料管理、智能会议记录两大高频办公场景形成成熟的落地产品。所有AI能力全程在用户终端本地运行,无需上传数据至云端,在切实提升办公效率的同时,从技术底层保障了数据主权与隐私安全。
一、四大核心技术,打造不可复制的端侧竞争力
端侧大模型的核心挑战,在于如何在消费级终端的有限算力下,实现接近云端的AI效果,同时保障全链路的数据安全与稳定运行。深思考基于多年大模型工程化落地经验,从底层推理到场景算法形成了完整的技术体系:
1.全栈自研算法,筑牢端侧能力底座
深耕端侧模型研发,打造0.5B/0.8B/1.5B/4B轻量版TinyDongni多模态模型,搭配自研端侧ASR语音识别模型(0.3B)与TTS语音合成模型(0.03B),实现端侧全模态能力自主可控。依托DongniForCausalLM自研架构与成熟的模型轻量化技术,普通办公设备也能完成高精度AI推理,构筑起独家核心算法优势。
2.极致工程优化,实现低耗高效运行
打造多项独家优化技术,实现低功耗、低延迟、低资源的端侧运行效果:
· 自研量化压缩技术:采用Dongni-AMDC自适应多维压缩方法,对模型权重与输入向量同步稀疏压缩,在保障效果的前提下大幅降低内存占用;
· 视觉与编译优化:对图像编码器Token数量极致压缩,成倍降低首次访问延迟;针对目标硬件执行编译优化,降低延迟并提升生成吞吐量;
· 多芯片协同调度:支持将模型分层部署到CPU、iGPU、NPU等不同芯片端,加速并行推理;
· 高效索引机制:万张图片、百万级Token文档规模下实现毫秒级检索响应,用户几乎无感。
3.全链路本地化,根源保障数据安全
从底层架构实现全流程本地闭环:文件解析、语音转写、AI推理、数据存储全程不出终端,从根源规避数据泄露、传输监听等风险。
全核心功能离线可用,无网出差、涉密会议室、企业内网等场景均可正常使用。
4.软硬全生态适配,适配多元办公环境
产品已完成Windows、Linux、OpenHarmony、统信 UOS、麒麟 KOS、Android多系统适配,全面兼容Intel、AMD、海光、瑞芯微、高通骁龙、兆芯、龙芯等主流及国产芯片,兼顾低功耗与运行效率,可全面适配企业办公、政务内网、个人办公等各类复杂终端环境与使用场景。
二、场景化深耕:两大产品覆盖办公核心痛点
基于端侧大模型技术底座,深思考聚焦办公场景的真实痛点,打造了两款成熟的端侧AI工具,深度融入日常办公流程,切实降低重复性工作成本。
Dongni AIPC Suite:读懂你的文件,更懂你的查找需求

针对本地文件查找难、素材整理耗时、多类型资料分散等办公高频痛点,产品打造了统一的本地多模态智能检索入口。
用户无需记忆文件名与保存路径,通过自然语言描述、图片参考、语音输入三种方式,即可在授权的本地目录中快速检索图片、视频、音频、文档四类资料。
系统会自动对本地图片按主题分类归档,对文档按业务维度自动聚合,同时内置多语言AI翻译能力,外文资料无需跳转第三方工具即可完成翻译。
所有检索、分类、翻译操作均在本地完成,既提升了资料管理效率,也保障了办公资料的安全性。
IDeepWise-AI Meeting:把时间还给思考,让会议价值完整留存

针对会议记录耗时、纪要整理繁琐、重点内容易遗漏等问题,智能会议助手覆盖了存量资料处理、实时会议记录、会后内容复用的完整会议流程。
用户既可以在会议进行时开启实时记录,边开会边同步生成转写内容;也可以导入已有的会议录音、视频、录屏文件,批量完成转写处理。
系统可自动区分不同发言人,同步生成会议摘要与待办事项,支持按时间段回溯原文内容,大幅减少人工听录、整理纪要的时间成本。
所有会议音频与转写内容均保存在本地,历史记录可随时回看复用,适配企业内部会议、客户访谈、培训记录等多种场景。
三、技术打底,让AI好用、敢用、放心用
深思考始终认为,好的技术应当“润物细无声”。依托全栈端侧技术能力,产品无需高配设备、无需联网环境、无需担心数据泄露,让每一位用户都能轻松享受AI办公的便利。
未来,深思考将持续深耕端侧大模型技术,不断优化模型性能与产品体验,推出更多覆盖办公、学习、生活场景的端侧AI解决方案。我们相信,只有扎根本地、守护用户数据主权的AI,才能成为真正人人可用的智能助手。

