AI邂逅青年科学家,大模型成科研搭子_近期活动-阿里云政企业务

 

2025年6月30日,首届魔搭开发者大会在北京主办,大会覆盖前沿模型与工具、MCP和Agent等七大论坛和65个主题。当天,作为核心议程之一的科研智能主题论坛,汇聚了科研机构与多领域科学家,以跨学科视角共探科研智能的未来方向。

 

 

在会上,CCF常务理事、阿里云副总裁、市场部总裁刘湘雯做开场致辞,并系统阐述了AI for Research & Development的理念和范畴。她强调,年轻科研力量是未来变革主体,阿里云通过“高校用云”计划降低技术门槛,推动计算与AI深度融合,加速科研范式从局部工具升级到系统性变革,赋能全球科研创新。

 

 

国科大他山联合创始人李瑀旸阐述了人机协同的AI Scientist闭环。基于LLM的假设生成与Robot Scientists的实验验证,构建了“Automatic General Scientist”(AGS)系统:决策智能体聚合知识库提出假设,模型智能体虚拟仿真验证,实验智能体对接物理环境(如星语5.0望远镜),数据智能体完成定量分析并反馈修正假设。团队还开发了AutoAstro(假设生成-验证闭环)、AstroInterpret(数据定性分析)等工具,依托科研创新平台推动AI for Science生态。同时提出“Agent for Science”模式,通过多智能体协作构建跨学科科研闭环,强化人机交互与领域工具集成,助力科研从“工具辅助”向“智能体驱动”跃迁。

 

 

他山交叉学科协会主席郑博元指出,AI for Science的范式跃迁需解决人脑处理海量数据与知识的瓶颈。团队提出科研智能体的L1-L4层级架构:L1为工具调用,L2为流程自动化(当前主流),L3引入长期记忆与自主规划,L4则形成具备科学思维的AI Scientist。通过整合2.2亿篇文献构建MCP知识库,开发Sequential Thinking MCP实现科学问题分解与验证闭环,并通过“硬科普计划”与跨学科协作推动生态落地。未来将以实验室为载体,联合产学研构建“Agent for Science技术积累-场景AI化-平台服务”的产业化闭环,以实干精神重塑科研范式。

 

 

中国科学院青藏高原研究所夏萃慧分享了洛书大模型的实践。针对气候变化引发的能源系统危机(如2022年西南水电短缺),洛书以“可解释性”为核心,构建地学领域时空Transformer架构。区别于传统NLP模型,洛书以时空定位的“时空块”为最小单元,集成100+物理变量,处理青藏高原等复杂地形的多维数据。通过融合QWQ推理模型,首次验证模型对季风期节律的精准捕捉,并通过“Joint Attention Drift”识别异常模式,推动模型自主举一反三。未来将结合智能体与具身感知设备(如卫星、无人机),实现灾害预警与动态调度的闭环,助力气候能源系统的韧性升级。

 

 

阿里云飞天实验室AI for Science负责人王征展示了AI在药物发现中的突破。围绕生物制药领域,团队构建了生物语言模型(多任务预测)、基因技术模型(序列生成与注释)及生物分子模型(3D分子与蛋白质建模)。基于Transformer架构,通过自监督学习处理海量生物数据,突破传统GNN的计算瓶颈,实现统一模型框架。百亿级分子库的虚拟筛选平台以“算力换精度”策略完成1000亿级候选分子筛选,显著提升新药发现效率,并在国际计算生物学竞赛中获二等奖。基因模型LucaOne融合基因与蛋白序列训练,实现秒级基因注释,支持病毒检测、磷酸循环蛋白发现等前沿研究。

 

 

生物计算研究专家郭玲则聚焦AI生物科研平台的智能蛋白设计。团队开发了单细胞转录组大模型(基因Former+Diffusion)、进化DNA建模、InstructPLM蛋白设计模型(PET降解酶验证成功率30%)及核酸设计工具。联合魔搭社区上线121个生物模型(下载量近2万),构建单细胞分析(20+MCP工具)、蛋白设计(GA平台Agent)、人群队列三大MCP体系,并推出BioDeepDiscovery科研助手,支持文献综述(800字+80篇引用)、科学假设生成及自动化生物计算。合作案例涵盖广谱抗菌肽研发、真菌荧光素酶挖掘(38个候选蛋白)及单细胞年龄预测模型,验证AI在生物工程化中的潜力。

 

 

英伟达资深解决方案架构师石道辰分享了AI在生命科学与医疗领域的应用。在医疗影像方面,结合MONAI框架与生成式合成数据技术,解决数据获取难题,支持2D/3D模型训练,并通过联邦学习实现数据隐私保护下的联合建模。VISTA-3D模型可精准分割骨盆、肝脏等器官,结合GPU光线追踪提升可视化交互体验。在药物研发领域,BIONEMO框架覆盖靶点发现、分子优化全流程,集成AI模型加速训练与推理。未来,多模态交互与AI模块将深度融入智能医院体系,推动医疗智能化转型。

 

 

北京科学智能研究院副院长李鑫宇提出,AI for Science正开启大科研时代。鄂维南院士的“四梁“”N柱”基础设施框架(数据驱动算法、高效实验方法、知识库、算力平台)支撑各领域科研创新。DeepM&D团队通过降维复杂度(ON³→ON)突破分子动力学模拟瓶颈,实现百亿原子级模拟;OpenLAM大原子模型覆盖元素周期表,推动微观建模标准化。实验室智能化方面,“一夜工作站”等自动化工具加速数据采集,400+科研人员参与设备改造,提升实验效率,为更多的科研人员服务。

 

 

中央美院吴小虎副教授从艺术视角探讨AI应用的矛盾与机遇。他指出,AI在艺术领域的挑战在于情感缺失与风格同质化,纯艺术创作需回归情感表达与独特性。通过案例展示,AI可辅助学生突破技术限制生成个性化作品(如结合AI与蓝晒工艺创作),但需人工临摹转化以形成个人风格。演讲强调AI在艺术教育中的双重角色:既需“反算法”激发创造力,又可突破常规模式提供灵感。

 

 

南京大学金伯文副教授则探索大语言模型(LLM)在历史文献处理中的应用。传统OCR工具难以处理古籍、手稿等复杂史料,而LLM凭借多语言识别、语义检索和结构化提取能力,将手工录入工作自动化。通过调用豆包、千问等API,外文档案翻译与关键信息提取准确率显著提升,甚至超越本科生水平。团队开发的文献处理平台实现从图像识别、翻译到结构化存储的全流程自动化,支持时间、责任人等元数据提取。

 

 

本次论坛见证了AI for Science从工具辅助向智能体驱动的范式跃迁。 阿里云通义千问系列模型与QWQ推理模型已深度融入科研全链条:在生物制药领域,通义千问语言模型通过蛋白质功能预测和分子动力学模拟加速药物研发;在古脊椎动物学中,千问系列通过文献结构化提取、外文档案翻译及数据清洗,助力DeepBone数据库建设;在历史文献处理中,通义千问的多模态能力实现古籍、外文手稿的自动识别与翻译。魔搭社区以通义千问为核心基座,提供12个生命科学模型和6个数据集,结合百链MCP协议,推动AI Agent共建共享。

 

未来,通义千问将持续以跨学科协作和开源生态为基石,通过多模态处理、抽象推理及代码生成能力,加速科研范式从数据驱动向智能驱动跃迁,让AI真正成为科研创新的核心引擎。