产业观察产业数字化管理平台
李福山团队Nature|超高分辨全彩QLED突破

Banner本文由论文作者团队投稿导读随着增强现实(AR)与虚拟现实(VR)技术的快速发展,显示系统正迈向“视网膜级分辨率”(>10,000 PPI)。在这一背景下,量子点发光二极管(QLED)因其高色纯度与可溶液加工特性,被认为是实现下一代近眼显示的关键技术路径。然而,当像素尺寸缩小至亚微米尺度时,传统技术面临三重核心挑战:图案难以高精度构建、RGB像素易串扰、器件效率与稳定性显著下降。这些问题从制造到物理机制层面共同制约了超高分辨显示的发展。针对上述瓶颈,福州大学李福山团队从纳米制造工艺与器件物理机制两个维度开展系统性研究,提出并实现了一体化解决方案,实现超高分辨全彩QLED的“像素级完美”,并建立了“结构—电场—性能”的内在关联。相关成果以“Nanoscale transfer-printed full-colour ultrahigh-resolution quantum dot LEDs”发表于Nature,青年教师林立华为第一作者,李福山教授为通讯作者。一、工艺突破:纳米尺度“精准印刷”全彩像素为解决高分辨率图案构建难题,团队提出硬质纳米压印—整体倒置转印(NP–TP)技术,实现亚微米尺度下量子点像素阵列的高保真复制与高效转移。该方法利用可重复使用的硬质硅模板,实现9,072–25,400 PPI范围内稳定图案精度,避免传统软印章形变问题。在此基础上,团队提出“双作用力动力学(DAFD)”策略,通过垂直压缩与横向收缩协同作用,实现量子点在微孔中的致密重排与无空隙填充,从而显著提升发光均匀性。此外,通过整体倒置转印与牺牲层保护设计,有效消除了多色图案化中的残留污染与RGB串扰问题,实现了高纯度、高一致性的全彩像素阵列构建。该工艺同时兼容柔性基底与钙钛矿量子点等敏感材料,展现出良好的通用性。图1:NP–TP工艺与高保真像素构建二、机制突破:揭示电场非均匀分布主导失效机制在器件物理层面,团队系统揭示:亚微米限域结构中电场非均匀分布是性能退化的关键根源。研究发现,像素边缘存在显著电场集中效应,会引发电流拥挤、非辐射复合增强及局部热积累,从而限制器件效率与寿命。针对这一机制,团队提出介电匹配策略:通过在电荷阻挡层引入TiO₂纳米颗粒,调控材料介电常数,使其与发光层匹配,从而实现电场均匀化。通过系统实验验证,明确建立了:介电匹配 → 电场均匀化 → 性能提升 的因果关系。在此基础上,红光QLED在12,700 PPI下实现:EQE:26.1%,寿命:65,190小时,绿光与蓝光效率分别提升124%和119%。图2:电场重构机制与介电匹配调控三、系统突破:实现可驱动的全彩显示原型在系统集成层面,团队进一步实现了:1)RGB像素化白光器件EQE达10.1%,刷新纪录,2)与CMOS驱动电路集成,3)构建可逐像素控制的显示原型。该原型能够实现动态显示,相当于“给每一个纳米像素配备独立控制电路”,验证了其在实际显示芯片中的应用潜力。图3:全彩器件与主动驱动显示验证四、总结与展望本研究实现了从纳米制造工艺 → 电场调控机制 → 系统级显示验证的全链路突破,不仅解决了超高分辨QLED“如何制造”的工程难题,更从物理本质上揭示了性能限制机制,并提出具有普适性的调控策略。这一“结构—电场—性能”协同优化范式,为下一代AR/VR显示及高端显示芯片发展提供了关键技术路径,具有重要的科学意义与应用前景。论文信息Lin, L., Wang, J., Hu, H. et al. Nanoscale transfer-printed full-colour ultrahigh-resolution quantum dot LEDs. Nature (2026). https://doi.org/10.1038/s41586-026-10333-w欢迎课题组投宣传稿请扫码联系值班编辑Banner编辑:赵阳

来源:中国光学发布时间:2026-04-02
亮点 | 基于微波光子信道化的宽带相控阵接收机

Photonics Research 2026年第2期Editors’ Pick:Shilong Chen, Xue Lan, Haoyan Xu, Zhiyuan Yang, Xinpeng Wang, Feifei Yin, Kun Xu, Ming Li, Yitang Dai, "Broadband phased array receiver based on microwave photonics channelization," Photonics Res. 14, 626 (2026)推荐阅读宽带相控阵接收机是5G/6G移动通信、卫星互联网、雷达探测和航空航天等领域的关键基础单元。随着多频段、多方向、多用户并发接入需求的快速增长,传统真时延相控阵方案在多波束灵活性、延时储备、系统体积功耗以及后端高速数模转换与数字处理复杂度等方面面临严峻挑战。针对这一问题,北京邮电大学戴一堂教授团队提出了一种基于微波光子信道化的宽带相控阵接收新方案,通过将宽工作频带划分为多个窄带信道并行处理,在各信道内独立实现移相波束形成,从而实现面向多用户的灵活接收。实验结果表明,该系统在4–12 GHz频段内实现了无波束斜视的多波束接收,极大降低了所需的延时量,并支持不同频段、不同方向来波信号的并行处理。该项工作为构建高灵活度、低SWaP的宽带相控阵系统提供了新思路,在未来无线通信与雷达电子系统应用中极具潜力。——张俊文教授,复旦大学Photonics Research 青编委随着5G/6G网络及军事、卫星、航空航天等领域对高速、高容量通信需求爆炸性增长,相控阵将继续在信号传输、接收和处理领域发挥不可替代的作用。目前,相控阵的发展需求不再局限于扩展工作带宽和消除波束斜视,还包括建立用户导向的波束形成架构,实现更小的体积、重量和功耗(SWaP),以及更高效、更灵活的收发组件等。光子真时延(True-Time-Delay,TTD)补偿技术是目前相控阵系统中采用的主流解决方案。然而,一方面TTD方案通常针对特定波束设计;在6G通信的实际应用中,例如不同频率的用户分布在不同方向时,TTD方案缺乏灵活性,难以在实际场景中实现多波束的同时形成;另一方面,大多数现有TTD方案要求提供的延迟等于阵列孔径引入的真实总延迟。对于大型阵列,这需要大量的延时波导储备和调谐范围,导致功耗、插损和体积增加。此外,系统后端对模数/数模转换器(ADC/DAC)提出了极高的带宽要求,即使是目前最先进的ADC,也难以满足数十吉赫兹范围的采样率需求。数字信号处理(DSP)单元还需要在整个频段执行数字信道化,导致计算规模庞大且功耗高。北京邮电大学戴一堂教授团队提出并演示了基于微波光子学的宽带信道化相控阵接收机,该方案将工作频带划分为多个窄带信道,每个信道内通过独立移相实现波束形成,以解决上述问题。相关研究成果以“Broadband phased array receiver based on microwave photonics channelization”为题发表于Photonics Research 2026年第2期。基于微波光子信道化的相控阵(CHannelized Phased Array,CHPA)架构如图1(a)所示。级联的强度-相位调制器产生具有N个梳齿的光频梳,放大后经解复用器分成N路,每一路都调制上来自不同阵元的接收信号,然后再复用到一起。周期性窄带滤波器阵列(Periodic Narrowband Filter Array,PNFA)由M个周期和带宽相同但波峰位置不同的FP滤波器组成,它们将宽带一阶信号进行信道化处理。同时,每一个信道的本振光频梳都经过一个可调光延时线对各梳齿进行相位加权——不同频率的光载波经过同一段延时后,附加不同的相位。然后信号与本振梳通过平衡探测器进行下变频,得到相权调控后的各阵元信号的相干叠加。整个过程的光谱与波形演化图如图1(b)、(c)所示。图1 CHPA的结构和示意图。(a) CHPA的架构;(b)在光链路上各节点模拟光谱演化;(c)由每个通道的延迟线控制的波形相位变化通过采用多波长光源和波分复用技术,不同阵元接收到的信号被排布到同一波导中的不同频率处。通过合理设计延迟量和频率间隔,就可以精确控制每个阵元的不同相位权重。当不同频率和方向的波束入射时,通过调节每个信道中延迟量可以实现波束扫描。在图2(a)中,光频梳的25 GHz自由光谱范围决定了延时扫描周期为40 ps,对应±90°的扫描范围。随着信道频率的降低,延时调谐范围也相应减小。基于时空映射关系,作为时间延迟Tv函数的阵列因子曲线可以转换为作为方向θ函数的雷达图,如图2(b)和2(c)所示。图2 波束形成的空时映射。(a)延时量与sinθ之间的线性对应关系;(b) 角域中的波束方向图;(c)延时域中的阵列因子实验设计了如图3所示的0°、-60°和+60°三个角度下4GHz、8GHz和12GHz三个信道,共9个来波信号;将他们同时接入系统,将测量结果绘制为延迟-功率曲线,然后进行时空转换,得到一系列波束图案。不同信道的用户可以在相同方向被接收;不同方向的用户也可以在相同信道被接收。这些结果表明在4–12 GHz的工作带宽内没有波束斜视。同时,系统在不同信道上实现不同方向的波束赋形,显示出面向用户接收的灵活性。同时,每个信道扫描全空间所需最大延迟量仅为40 ps,而TTD方案每个阵元在相同覆盖范围内都需要625 ps。图3 在4-12 GHz频段中±60°内的9个波束测试方向图该研究将微波光子信道化技术创造性地应用在宽带相控阵系统中,将宽工作频段划分为多个窄带信道并行处理。研究具有三方面影响和意义。第一,目前大部分系统(如TTD方案)的单一静态架构难以满足点对点用户通讯需求,而CHPA可以以用户为导向在不同信道中同时独立地进行多个波束形成。第二,系统使用一种虚拟延时进行相位控制,所需的延时量远远小于真延时方案,在同时多波束和大规模阵列场景中大大降低系统的SWaP,并具备向芯片级方案的可扩展性。第三,信道化并行窄带输出不需要末端大带宽的收发组件,DSP不需要处理海量数据和数字分频段处理。“在实际的5G/6G通讯和雷达电子等应用网络中,用户信号通常以多载波形式分布在不同频段和不同方向,CHPA架构灵活高效地运用资源,为建立用户导向的波束形成网络提供了一种新思路。”通讯作者戴一堂教授表示,“该系统稳定可靠,且规模不受阵列数量影响,在大规模阵列应用中更加凸显优势。此外,由于光电器件集成技术的高速发展,该系统也具备全架构集成的可行性,有望进一步制造为原理样机或实体芯片,并在新一代电子通讯中展现其实用性。”在后续工作中,研究团队将测试并优化系统的性能,如噪声系数、SWaP等;根据实际应用场景需求搭建外场环境和原理样机,进一步展示其解决实际问题的能力;优化系统组成,设计芯片级实现方案,并研发芯片模块,将其推广至电子雷达与通讯的应用领域中。主要作者简介陈世龙,2022年于北京邮电大学电子工程学院获得工学学士学位,现于北京邮电大学电子工程学院、信息光子学与光通信全国重点实验室攻读博士学位。主要研究方向为微波光子信道化、微波光子阵列信号处理等。戴一堂,北京邮电大学四级教授、硕博导师,清华大学电子工程系博士,加拿大渥太华大学、美国康纳尔大学博士后。曾获教育部新世纪优秀人才计划(2014年)、北京高等学校青年英才计划(2013年)、教育部自然科学奖二等奖(2012年,排名第3)。主要从事微波光子技术、光信息处理和器件、超快光学等方面的研究。自2007年起,他的研究重点聚焦于光子技术在系统中的应用,2010年至今多次参与微波光子技术的需求论证,并作为课题组长/副组长参与多项相关863课题等国家项目。已署名发表期刊论文百余篇,论文的引用次数已超过一千次。撰稿 | 北京邮电大学 陈世龙推荐阅读:[1].Mingjian Li, Linxiao Guo, Defan Sun, Qizhuang Cen, Wei Li, Yitang Dai, Tengfei Hao, Ming Li, "Integrated coupled optoelectronic oscillator for ultra-low-noise and ultra-wideband tunable microwave generation," Photonics Res. 13, 2618 (2025)[2].Yiwen Lu, Qizhuang Cen, Tong Yang, Xinpeng Wang, Chong Liu, Feifei Yin, Kun Xu, Ming Li, Yitang Dai, "Optoelectronic hybrid oscillating fiber-optic sensor with attosecond precision and reconfigurable sensitivity," Photonics Res. 12, 2293 (2024)如有光学论文写作/实验笔记经验、绘图工具介绍,或其他优质稿件,欢迎投稿至ioptics@clp.ac.cn。字数控制在2000-3000字为佳,稿件一经录用,我们将提供具有竞争力的稿酬。期待你的来稿!END由于微信公众号试行乱序推送,您可能没办法准时收到“爱光学”的文章。为了让您第一时间看到“爱光学”的新鲜推送, 请您:1. 将“爱光学”点亮星标(具体操作见文末)2. 多给我们点“在看”点在看联系更紧密

来源:爱光学发布时间:2026-04-02
刚刚,阿尔忒弥斯2号成功发射,人类时隔54年重返月球轨道

刚刚,阿尔忒弥斯 2 号(Artemis II)从佛罗里达州的肯尼迪航天中心发射升空。四名宇航员将绕过月球背面,然后返回地球。这是美国国家航空航天局(NASA)“阿尔忒弥斯计划”的首次载人飞行,也是自 1972 年阿波罗 17 号以来,人类首次重返月球。“阿尔忒弥斯计划”启动于 2017 年,其宏伟目标是让人类重返月球并建立月球基地,为未来的火星载人任务做准备。该计划的首次任务“阿尔忒弥斯 1 号”已于 2022 年底成功发射,这是一次完全无人驾驶的绕月测试飞行,主要验证新一代深空探索系统的性能,为后续载人任务铺路。这项为期约 10 天的任务将测试太空发射系统(SLS)火箭和猎户座飞船,为阿尔忒弥斯 3 号、4 号、5 号及以后的月球着陆做准备。同时要求这四位宇航员在远离地球的情况下,以更高的自主性操作并做出关键决策。SLS 是 NASA 有史以来建造的最强大的火箭,能够向月球运送超过 27 公吨的有效载荷,包括设备、仪器、科学实验装置和货物。猎户座航天器位于火箭最顶端,是机组人员前往月球的“座驾”。阿尔忒弥斯 2 号的机组人员将他们的猎户座舱命名为“诚信号”(Integrity),他们表示这个词体现了信任、尊重、坦诚与谦逊。图 | 阿尔忒弥斯 2 号任务简介(来源:美国宇航局)任务期间,机组人员将对“诚信号”的关键生命支持系统进行测试,包括空气、水和安全设备,以及厕所。这也将是宇航员首次测试深空厕所系统,相比阿波罗时代,这是一个显著的升级,当时的机组人员只能依赖所谓的“排泄管”。阿尔忒弥斯 2 号机组由 4 名宇航员组成,包括三名美国宇航员:里德·怀斯曼(Reid Wiseman)、维克多·格洛弗(Victor Glover)和克里斯蒂娜·科赫(Christina Koch),以及一名加拿大宇航员杰里米·汉森(Jeremy Hansen)。其中,科赫成为第一位前往月球的女性,格洛弗是第一位有色人种,而加拿大人汉森是第一位非美国人。(来源:维基百科)咖啡、锻炼设备、深空厕所,样样具备搭载 4 名宇航员的飞船猎户座,全称猎户座多用途载人飞船,是由洛克希德·马丁公司(Lockheed Martin)为 NASA 建造的航天器。该公司是美国乃至全球最大的国防和航空航天综合企业,总部位于马里兰州。主营航空、导弹和火控、旋翼和任务系统及空间系统,是美国国防部和主要航天项目的核心供应商,以 F-35、F-16 等机型和先进防务技术闻名。 图 | 猎户座(来源:维基百科)该航天器由三个主要部分组成,每一部分都拥有独立的推进系统,用于在阿尔忒弥斯任务的不同阶段控制航天器的轨迹与姿态。这三个部分分别是:发射逃逸系统、服务舱以及乘员舱。发射逃逸系统的设计初衷是,一旦在发射或上升至轨道的过程中发生紧急情况,能迅速将飞船及其机组人员带到安全地带;服务舱配备了猎户座的主推进系统,是为飞船航程提供动力与燃料的能量工厂。该舱段还负责轨道机动和位置控制,并承担热控和太阳能电池板供电等关键职能;乘员舱是宇航员工作与生活的空间。相比阿波罗舱,猎户座空间增加了约 60%,内部可利用体积约为 9 立方米。美国宇航局表示,这相当于两辆小型货车的总和。图 | 阿波罗飞船与猎户座飞船的尺寸对比(来源:reddit)最显著的改进是,猎户座配备了通用的废物处理系统,相比阿波罗时代的收集袋,猎户座拥有更先进的吸气技术和人体工程学设计,能更好地处理失重环境下的排泄物,并能回收尿液转化为纯净水(虽然此功能主要在空间站使用,但技术已集成)。猎户座飞船内取消了数千个物理开关,取而代之的是三块巨大的玻璃座舱显示屏。宇航员可以通过电子界面操控飞船,甚至在睡眠舱通过手持平板电脑监控系统。为了防止肌肉萎缩,舱内设有简易的抗阻力锻炼设备。此外,由于飞船会穿过辐射强烈的范艾伦辐射带,舱内特别设计了名为“风暴避难所”的区域,在太阳高能粒子爆发时,宇航员可以躲在防辐射性能更好的隔间内。舱内设有折叠式的睡眠舱,保证四人可以同时休息。食品加热装置也得到了升级,机组人员甚至可以享用到特别定制的加压包装咖啡和脱水美食。图 | 阿尔忒弥斯 2 号准备的菜单(来源:NASA)猎户座主要依靠隔热罩在溅落前进行减速。当它在稠密大气中疾驰时,剧烈的摩擦会使隔热罩表面温度飙升至 2,760°C(5,000°F),比熔岩温度高出 2.5 倍。然而,得益于卓越的隔热设计,舱内依然能维持在 20 多摄氏度的舒适宜人环境。在海上溅落后,飞船可能会以任何角度漂浮。猎户座顶部配备了五个醒目的橙色气囊,一旦入水,它们会自动充气,帮助飞船在风浪中扶正,确保宇航员能安全、顺利地撤离舱体。根据行星协会的数据,SLS 火箭计划自 2011 年启动以来,已耗资 238 亿美元。而猎户座航天舱在计划开始后的 10 年里,研发成本也达到了 204 亿美元。加上地面基础设施的建设费用,从 2006 年到 2022 年首次测试发射期间,NASA 在整个计划上的总支出高达 499 亿美元。登月之路自 2023 年 6 月以来,宇航员里德·怀斯曼、维克托·格洛弗、克里斯蒂娜·科赫以及加拿大航天局(CSA)宇航员杰里米·汉森一直在为他们的登月之旅做准备。(来源:NASA)作为阿尔忒弥斯 2 号的指令长,怀斯曼不仅拥有深厚的海军背景,更是系统工程领域的专家。他曾在美国海军服役 27 年,担任过顶尖试飞员,并在中东地区执行过多次战斗部署。2014 年,他在国际空间站(ISS)驻留的 165 天里,曾创下单周投入 82 小时进行科学实验的纪录。除了卓越的飞行技巧,怀斯曼还曾出任 NASA 宇航员办公室主任,负责管理全美宇航员的培训与任务分配。格洛弗担任此次任务的飞行员,负责“猎户座”航天器的精密操作与导航。格洛弗的职业生涯始终与“第一”紧密相连:他曾是 SpaceX“龙”飞船首次商业载人运营飞行的飞行员,并因此成为首位在国际空间站长期驻留的黑人宇航员。作为拥有四项硕士学位的海军上校,他不仅精通复杂的飞行系统,还曾在美国参议院担任立法研究员,具备跨学科的战略视野。任务专家克里斯蒂娜是航天界公认的“纪录打破者”。在加入 NASA 之前,她曾在南极和格陵兰的极端环境下长期从事科学研究,这种坚韧的心理素质为其太空生涯奠定了基础。2019 年,克里斯蒂娜在国际空间站连续驻留 328 天,刷新了女性单次太空飞行的最长时间纪录,并参与完成了人类历史上首次全女性太空行走。来自加拿大航天局的任务专家汉森,是机组中唯一的非美国籍成员,也是国际合作精神的象征。汉森出身于安大略省的农场,后成长为加拿大皇家空军的王牌战斗机飞行员。尽管阿尔忒弥斯 2 号是他的首次太空飞行,但他已在地面为航天事业奉献了十余年,不仅担任过空间站与地面的首席通信官,还曾参与极端环境的水下模拟任务。阿尔忒弥斯 2 号的实战化训练为了确保这项史诗级任务万无一失,四名机组成员在过去几年接受了涵盖地质学、生存技能及深空导航在内的全方位高强度训练。阿尔忒弥斯 2 号训练的一个关键部分是月球观测与摄影。在休斯敦的约翰逊航天中心,宇航员们通过研习月球背面,学习如何识别撞击坑形状、表面纹理、颜色变化和反射率。虽然此次任务不会登月,但机组将从月球轨道进行详细观测,为未来的阿尔忒弥斯登月任务收集重要数据。除了教室授课和模拟器操作,机组还在艾灵顿机场驾驶 T-38 喷气式教练机进行飞行训练。T-38 能让宇航员暴露在高工作负荷、动态变化的飞行条件下,培养其空间感知和适应能力,这些技能能直接转化为在太空压力下做出果断决策的能力。图 | 阿尔忒弥斯 2 号机组成员在埃灵顿机场进行 T-38F 飞行训练(来源:NASA)此外,机组人员穿着“猎户座机组生存系统”宇航服参加了多次训练,以支持对猎户座飞船环境控制与生命支持系统的测试。这套宇航服能在发射、返回和应急情况下提供压力、氧气及热保护;而飞船的生命支持系统则负责管理整个任务期间舱内的氧气、水、温度和机组整体健康状况。在约翰逊航天中心的猎户座任务模拟器内,机组反复排练了从常规操作到应急响应的每个阶段。模拟训练旨在教授宇航员如何诊断故障、管理多重优先级任务,以及在与地球通信延迟的情况下独立做出决策。通过这一过程,四位宇航员已精通猎户座舱内的每一个细节。图 | “阿尔忒弥斯 2 号”任务组进行月球摄影练习(来源:NASA)尽管阿尔忒弥斯 2 号不会降落在月表,但宇航员在偏远原始环境(如冰岛的火山区)中培养的地质学基础,对于实现任务的科学目标至关重要。机组将在轨道上检查包括撞击坑和月壤在内的特定地貌,记录颜色和纹理的变化,帮助科学家解读月球的地质历史。任务将以在海面溅落告终。机组在 NASA 的中性浮力实验室(NBL)完成了水下生存回收训练。他们演练了在不同场景下安全离开猎户座飞船、稳定船体并登上救生筏的技巧,这些是他们从月球归来后最依赖的生存技能。阿尔忒弥斯 2 号机组还在佛罗里达州肯尼迪航天中心完成了综合地面系统测试。包括全副武装的测试、全任务演习以及发射日模拟。阿尔忒弥斯 2 号任务是“阿尔忒弥斯计划”的关键里程碑,将为阿尔忒弥 3 号测试在轨能力,以及阿尔忒弥斯 4 号和阿尔忒弥斯 5 号两次载人登月任务提供数据与信心。如果阿尔忒弥斯 2 号一切顺利,它将极大提振信心、加速后续进度;若有问题,也能在载人前暴露并修复,避免更大风险。参考链接:1.https://time.com/7346146/artemis-ii-launch-nasa-astronauts-moon-mission/?utm_source=twitter&utm_medium=social&utm_campaign=editorial&utm_content=2901262.https://theconversation.com/artemis-ii-the-first-human-mission-to-the-moon-in-54-years-launches-soon-with-a-canadian-on-board-2738813.https://www.nasa.gov/centers-and-facilities/johnson/preparing-for-artemis-ii-training-for-a-mission-around-the-moon/4.https://www.lockheedmartin.com/en-us/products/orion.html5.https://www.lockheedmartin.com/en-us/news/features/2026/things-you-may-not-know-about-orion.html6.https://www.nasa.gov/missions/artemis/artemis-2/artemis-ii-whats-on-the-menu/?utm_source=TWITTER&utm_medium=NASA&utm_campaign=NASASocial&linkId=925358682运营/排版:何晨龙

来源:DeepTech深科技发布时间:2026-04-02
被奥特曼公开讨厌的华人女记者:OpenAI内斗混乱,普通人正在被AI帝国欺骗

在 AI 行业最炙手可热的时刻,郝珂灵(Karen Hao)可能是硅谷“最不受欢迎”的记者之一。这位麻省理工学院机械工程专业出身的美籍华裔记者,曾任《麻省理工科技评论》高级 AI 编辑、《华尔街日报》记者,现为《大西洋月刊》撰稿人。2025 年,她被《时代》杂志列入 TIME100 AI 名单,评语是“从根本上塑造了许多人对 AI 革命中心公司的认知”。同年 5 月,她出版了《AI 帝国:山姆·奥特曼的 OpenAI 之梦和梦魇》(Empire of AI: Dreams and Nightmares in Sam Altman 's OpenAI),一举登上《纽约时报》畅销书榜。这本书的编写基于郝珂灵超过 250 人的采访,其中 90 多位是 OpenAI 现任或前任员工和高管,深入调查了 OpenAI 的内部运作以及 AI 行业对全球劳工、环境和社会的影响。(来源:MIT TR)最近,被称为“AI 吹哨人”的她接受了 YouTube 频道 The Diary of a CEO 的专访。视频一经上线,不到一周播放量已突破 200 多万。在两个小时的对话中,郝珂灵详细阐述了自己对 AI 行业的批判性观察,普通人和世界正在经历和遭受的困境。她还披露了大量关于山姆·奥特曼(Sam Altman)和 OpenAI 的内幕,并提出了一个核心论断:这些 AI 公司的运作方式,与旧时代的帝国别无二致。(来源:Youtube)一个硅谷局内人的觉醒在采访开头,郝珂灵介绍,她走上科技记者这条路,是因为一次幻灭。她在 MIT 学的是机械工程,毕业后搬到旧金山,加入了一家专注于应对气候变化的科技创业公司。“我当时真的相信硅谷的使命,”她回忆道。然而,入职几个月后,董事会以公司不盈利为由解雇了 CEO。“那是一个转折点。我意识到,如果这个地方最终是为了盈利而存在,而世界上很多真正需要解决的问题:比如气候变化,并不能带来利润,那我们到底在做什么?”她开始重新思考自己的职业方向。两年后,她加入《MIT 科技评论》,成为全职 AI 记者。“我想探索的问题是:谁有权决定我们建造什么技术?金钱和意识形态如何驱动这些技术的生产?我们如何确保创新生态系统真正服务于全世界的人?”2019 年,她深入 OpenAI 办公室做了三天采访,最终在 2020 年发布了一篇深度报道《OpenAI 拯救世界背后混乱而隐秘的真相》(The Messy, Secretive Reality Behind OpenAI’s Bid to Save the World)。文章发表后,OpenAI 高层非常不满。因为她在书中引用了山姆·奥特曼(Sam Altman)发给全公司的邮件,高层认为这个影响“非常不好”。图 | 郝珂灵的深度报道,图片封面分别为当时 OpenAI 高层:Greg Brockman,、Ilya Sutskever 和 Dario Amodei(来源:麻省理工科技评论)从那以后,OpenAI 对她关上了大门。“有一次,我的同事收到 OpenAI 的新闻稿,想转给我跟进。OpenAI 的人说:‘不行,我们和她有点过节。’”但郝珂灵认为这反而成全了她。“当时我觉得自己搞砸了,甚至怀疑是不是应该对他们更友善一些。但现在回头看,正因为他们的门永远不会为我打开,我才能真正独立地报道我看到的事实,不管这些公司喜不喜欢。”这也是郝珂灵编写《AI 帝国》这本书的重要起点。那么为什么把这本书叫做《AI 帝国》?郝珂灵在采访中解释说,“帝国”是她找到的唯一能够完整涵盖这些公司行为模式的隐喻。她在采访中详细阐述了 AI 公司与旧时代帝国的四个平行之处:第一,侵占不属于自己的资源。这些公司声称对艺术家、作家和创作者的知识产权拥有使用权,用于训练模型。它们还在全球各地疯狂圈地,建造超级计算设施。第二,剥削大量劳动力。它们雇佣数十万承包商进行数据标注工作,工资低廉,工作条件恶劣。同时,它们设计的工具本身就是为了自动化劳动,进一步侵蚀劳动者的权益。第三,垄断知识生产。“如果世界上大多数气候科学家都由化石燃料公司资助,你觉得我们能得到准确的气候危机图景吗?同样的逻辑,AI 行业雇佣和资助了世界上大多数 AI 研究人员。”她举了 Google 解雇 AI 伦理团队负责人蒂姆尼特·格布鲁(Timnit Gebru)的例子。格布鲁本来被聘来批评 Google 正在开发的 AI 系统,当她合著了一篇揭示大语言模型负面影响的论文时,却被解雇了。第四,帝国叙事。“帝国总会告诉公众:我们是好帝国,我们必须成为帝国,因为世界上还有坏帝国。如果你让我们获取所有资源、使用所有劳动力,我们承诺会给你带来进步和现代化。但如果邪恶帝国先做到了,我们就会坠入地狱。”郝珂灵指出,在 OpenAI 早期,这个“邪恶帝国”是 Google。而现在,它变成了中国。AI 领袖们的帝国“宫斗”在 250 多次对科技从业者的采访中,郝珂灵还发现了一个有趣的现象:没有人对奥特曼持中立的看法。“他们要么认为他是这一代最伟大的科技领袖,堪比现代的乔布斯;要么认为他极其善于操纵人、是个骗子。”她分析说,这种两极化取决于你是否认同奥特曼的愿景。“如果你认同,他就是你能拥有的最大资产,这个人极其善于说服,讲故事的能力一流,能调动资本,能招募人才,能获取实现愿景所需的一切资源。但如果你不认同,你就会觉得自己被他操纵了,被拉去支持一个你根本不同意的愿景。”Anthropic CEO 达里奥·阿莫代伊(Dario Amodei)就是后者的代表。他曾是 OpenAI 的高管,最初以为奥特曼和自己是同一条船上的人,后来却感到被利用了,他的技术能力被用来实现一个他根本不认同的未来。采访中,郝珂灵还披露了一些关于奥特曼的内幕:2015 年,奥特曼在一篇博客中写道:“超人类机器智能的发展可能是人类持续存在面临的最大威胁。”但郝珂灵指出,这篇文章是专门写给一个人看的——埃隆·马斯克(Elon Musk)。“当时马斯克到处宣扬 AI 是最大的生存威胁。奥特曼需要说服马斯克加入,所以他的语言完全在跟风追捧马斯克的说法。”后来,当 OpenAI 需要从非营利转型为营利组织时,伊尔亚·苏茨克维(Ilya Sutskever)和格雷格·布罗克曼(Greg Brockman)最初选择了马斯克担任 CEO。但奥特曼私下找到老友布罗克曼,说:“把这么强大的技术交给马斯克真的好吗?他是名人,压力很大,可能会做出不可预测的事。”这番话说服了布罗克曼,布罗克曼又说服了伊尔亚。马斯克因此出局,最终愤而离开,这也是他至今与奥特曼缠斗的起点。2023 年底,OpenAI 董事会突然解雇奥特曼,震惊了整个科技圈。郝珂灵采访了六七位直接参与或接触决策过程的人士,还原了这一事件的来龙去脉。故事要从伊利亚·苏茨克维说起。这位 OpenAI 联合创始人兼首席科学家,长期以来对奥特曼的领导方式感到不满。他认为奥特曼在公司内部制造了太多混乱,让团队互相竞争、对不同人说不同的话。在他看来,奥特曼不仅没有缓解 ChatGPT 爆火后的混乱局面,反而在火上浇油。但伊尔亚纠结了很久才决定开口。“他担心如果奥特曼发现了会对自己不利。”他先找到独立董事海伦·托纳(Helen Toner)试探口风,然后逐渐敞开心扉。与此同时,时任首席技术官米拉·穆拉蒂(Mira Murati)也向董事会表达了类似的担忧。独立董事们开始调查,发现了一些令人不安的事实。比如,Open AI 董事亚当·德安杰洛(Adam D'Angelo)在一次旧金山派对上听到传言,说 OpenAI 的创业基金结构有问题。等他们拿到文件才发现,那根本不是“OpenAI 的创业基金”,而是“奥特曼的创业基金”。“这是我们反复遇到的情况,”郝珂灵说,“奥特曼描述的情况和实际情况之间,总是存在不一致。”最终,董事会决定解雇奥特曼,而且要快。他们担心奥特曼一旦察觉,凭他的说服能力,这件事就做不成了。于是,他们在几乎不通知任何人的情况下执行了这个决定。微软在行动前几分钟才接到电话。结果可想而知:所有利益相关方都愤怒了,一场让奥特曼回归的运动随即展开。几天后,奥特曼重新坐上了 CEO 的位置。而伊尔亚再也没有回来,米拉也在不久后离开。郝珂灵引用了伊利亚的一句话:“我不认为奥特曼是那个应该掌控 AGI 按钮的人。”数据标注工人:AI 繁荣背后的隐形劳工除了 OpenAI 内部的混乱之外,郝珂灵还在采访中提到受到这些 AI 公司影响的普通人们。采访中,郝珂灵多次提到《纽约杂志》最近的一篇深度报道,讲述了大量被裁员的白领如何沦为数据标注工人。“这些人是高学历人群:大学毕业生、博士、律师、医生,甚至获奖的好莱坞导演,他们被解雇后找不到工作,就被这个行业吸收了。”数据标注是什么?简单说,就是用人类经验教 AI 回答问题。ChatGPT 之所以能聊天,是因为有成千上万的人坐在电脑前,一条一条地示范“当用户这样问的时候,你应该这样回答”。单条数据标注工作的时薪通常很高,因此吸引了许多人参与,对一些人来说,这甚至是关键营生。郝珂灵描述了这些工人的处境:“他们守在电脑前,等着通知项目什么时候开始。因为他们不知道项目什么时候来、什么时候结束,所以必须在窗口期内拼命干活。”她引用了报道中一位女性的故事:项目来的时候,正好是她孩子放学回家的时间。她疯狂地敲键盘,孩子过来跟她说话,她只感到恼火,直接冲孩子吼了起来。这位母亲对郝珂灵说:“因为这个工作,我变成了一个怪物。我连上厕所的时间都没有,更别说照顾孩子了。”更讽刺的是,这些人正在训练的模型,很可能就是让他们失业的那个模型。“一个市场营销人员被裁员,然后去做数据标注,训练模型学会做市场营销。如果模型学会了,就会有更多市场营销人员被裁。这是一个恶性循环。”郝珂灵指出,这打破了传统的职业阶梯。“以前是入门级、中级、高级的晋升路径。现在中间被挖空了,只剩下高层和底层。人们怎么往上走?”这样的工作机会也只是在不断挤占人们自身的生存空间。数据中心:看不见的环境代价除了个人生存问题之外,AI 帝国还在造成更大的环境问题。在采访中,郝珂灵展示了一张图:Meta 在美国路易斯安那州规划的超级计算设施,面积是曼哈顿的五分之一,耗电量相当于纽约市平均用电量的一半。“OpenAI 在德州阿比林的设施,将消耗超过纽约市 20% 的电力。”但更触目惊心的是埃隆·马斯克(Elon Musk)在美国孟菲斯建造的 Colossus。“那是一个工薪阶层社区,黑人和棕色人种为主。马斯克用了 35 台甲烷燃气轮机来供电。居民们怎么发现这件事的?他们闻到了客厅里好像有煤气泄漏的味道。”她指出,这个社区本就长期遭受环境种族主义的侵害,肺癌发病率极高。现在,这个超级计算机正在向空气中排放数千吨有毒物质,加剧儿童的哮喘症状,恶化成年人的呼吸系统疾病。“而这些社区甚至没有被告知会成为这些设施的所在地。”主持人接着问:你觉得这些 AI 公司是在“欺骗”公众吗?“是的。”郝珂灵回答得很干脆。她认为 AI 领袖们不仅在欺骗公众,也在欺骗自己。她用电影《沙丘》来类比。在这部科幻史诗中,各大家族争夺“香料”,同时利用宗教神话来控制民众。主角保罗·厄崔迪(Paul Atreides)来到 Arrakis 星球,那里流传着一个关于救世主降临的神话。保罗知道这是神话,但他选择扮演救世主的角色,以便更好地控制人民、实现自己的目标。“问题是,因为他日复一日地活在这个神话中,他自己也开始分不清了,他到底是在演救世主,还是真的成为了救世主?”郝珂灵认为,AI 领袖们也是如此。“一方面,他们清楚地知道自己在制造神话。我有大量内部文件显示,他们非常清楚如何通过炫目的技术演示、精心设计的使命宣言来争取公众支持。另一方面,因为他们必须每天活在这个神话中,他们也迷失在其中了。”“所以当 Anthropic CEO 达里奥·阿莫代伊说他认为有 10% 到 25% 的概率未来会是灾难性的,他既是在主动制造神话,也是在迷失于神话。如果你问他是不是真的相信,他会说'是的',因为他已经分不清什么是表演、什么是信念了。”打破帝国叙事,从造更多的“自行车”开始采访最后,主持人问:就算观众认同你说的一切,他们又能做什么?郝珂灵给出了自己的解法。她认为,首先要认识到,这些公司需要持续的资源、数据和劳动力才能继续运转。“OpenAI 的员工告诉我,公司内部都知道,要达到收入目标,一切都必须完美运转。每个人都得用他们的产品,每个地方都得采用他们的服务,数据中心必须按计划建成。”“如果我们不同意他们在做的事,就别让一切完美运转。”她建议人们可以:拒绝捐赠数据(支持艺术家和作家的版权诉讼);在学校和公司讨论 AI 采用政策;反对当地数据中心的建设;支持替代方案的发展。她特别强调了“AI 的自行车”这个概念。“大语言模型是 AI 的火箭。资源消耗巨大,为一部分人提供巨大价值,同时给另一部分人带来巨大代价。为什么我们不多造一些 AI 的自行车?”她举了 DeepMind 的 AlphaFold 作为例子。这个系统能预测蛋白质折叠结构,对药物研发和理解人类疾病意义重大,2024 年获得了诺贝尔化学奖。“它用的是小型、精选的数据集,计算资源需求大大降低,能耗也低得多,但提供了巨大的公共价值。”“我要说的不是这些技术没有用处,而是生产这些技术的政治经济结构正在对人们造成大量伤害。研究表明,同样的能力完全可以用更高效的方法、更少的资源消耗来实现。”采访结束时,郝珂灵说了一组数据:80% 的美国人认为 AI 行业需要被监管。“什么时候 80% 的美国人能在一件事上达成一致?”全球各地已经爆发了数十起反对数据中心的抗议活动,其中一些已经成功阻止或禁止了项目。“我去过几十个城市做新书分享,每一场都是满座,每一场观众都在讨论同样的问题。对话正在发生。”“所以,我们应该打破帝国叙事,开辟 AI 发展的新路径,一条对所有人都有益的路径。”参考链接:采访视频:https://www.youtube.com/watch?v=Cn8HBj8QAbk运营/排版:何晨龙

来源:DeepTech深科技发布时间:2026-04-01
Opto-Electronic Advances (OEA) 招募青年编委

期刊简介Opto-Electronic Advances(光电进展,简称OEA)是由中国科学院光电技术研究所主办并出版的国际学术期刊。期刊于2018年3月创刊,最新影响因子22.4,入选中国科技期刊卓越行动计划二期“英文领军期刊”项目,连续多年被评为“中国最具国际影响力学术期刊”。为进一步推动光电领域的学术发展、引领学科前沿方向、打造国际一流科技期刊,OEA现面向全球公开招募青年编委,诚邀海内外优秀青年学者加盟,共筑高水平学术出版平台。欢迎有意向的青年学者填写申请表,详见文末 “报名方式”。招募要求申请条件1)原则上年龄不超过45周岁,助理教授及以上职称。2)以第一作者或通讯作者身份发表过多篇SCI论文,每年SCI论文出版数量不少于5篇。3)热爱学术出版事业,愿意积极投入期刊建设与发展。4)具有国际化学术视野,有同行评审和期刊服务经验者优先。主要职责1)期刊宣传:参与期刊推广工作,在国内外重要学术会议、学术交流活动中宣传与推荐期刊。2)撰稿与约稿:围绕学科前沿热点,撰写或邀约高质量稿件。3)学术审稿:承担期刊稿件同行评议工作,严把学术质量关,遴选优质创新成果。4)参与期刊建设:积极参加期刊主办的学术会议与活动,为期刊高质量发展建言献策。青年编委权益1)以青年编委身份参与光电期刊集群组织的各类学术交流活动;2)每年根据贡献评分,评分高的可获得优秀青年编委荣誉证书;3)表现特别突出者有机会晋升为集群期刊正式编委;4)获得在国际学术平台展示研究成果、提升国际影响力的机会。任期任期2年,届满时根据表现和贡献续聘。报名方式:有意向专家可以直接扫描下方二维码填写表格并上传简历。报名时间从即日起至2026年4月15日截止,编委会审批后会通过邮箱、电话与您联系。(扫码填表)链接:https://tcnfzobsuhcl.feishu.cn/share/base/form/shrcnH3QNjwQqL5qaxf7xfHGuOcOpto-Electronic Advances : Call for Youth Editorial Board MembersJournal InformationOpto-Electronic Advances (OEA) is a high-impact, open access, peer reviewed SCI journal with an Impact Factor of 22.4, placing it among Q1 of JCR. OEA has been indexed in SCI, EI, DOAJ, Scopus, CA and ICI databases, and expanded its Editorial Board to 41 members from 17 countries (average h-index 66). To further advance research in the field of optoelectronics, lead the forefront of the discipline, and build a world-class scientific journal, OEA is now openly recruiting youth editorial board members from around the globe. We sincerely invite outstanding young scholars worldwide to join us in building a high-level academic publishing platform.Young scholars are welcome to apply through completing the application form, details of which can be found in the "How to Apply" section at the end.Application InformationQualifications1) In principle, applicants should be no more than 45 years old and hold a position of assistant professor or above.2) Applicants should have published multiple SCI papers as first authors or corresponding authors, and the number of SCI papers published per year should be no less than 5.3) Applicants should have a strong passion for academic publishing and be willing to actively engage in the development and the growth of the journal.4) Applicants should have a global academic vision, and experience in peer review or journal service is preferred.Responsibilities1) Journal Promotions: publicize, recommend, and promote the journal at academic events.2) Manuscript Contributions: submit and invite high-quality manuscripts to the journal focusing on cutting-edge hot topics.3) Peer Review: undertake the peer review of the manuscripts, rigorously uphold high academic standards, and recommend outstanding and innovative work for publication.4) Journal Development: actively participate in academic events organized by the journal, provide constructive suggestions, and offer insights for the high-quality development of the journal.Benefits1) Participate, as a Youth Editorial Board Member, in various academic events organized by the Opto-Electronic Journals Group;2) Youth Editorial Board Members with outstanding contributions will receive a Certificate of Excellence for Outstanding Youth Editorial Board Member;3) Those who demonstrate exceptional performance will have the opportunity to be promoted to a full editorial board member of the Opto-Electronic Journals Group based on their contributions;4) Gain opportunities to present research achievements on international academic platforms and enhance international influence. Term of OfficeTwo years, with possible re-appointment upon expiration based on performance and contributions.How to Apply:Interested applicants can scan the QR code below to fill out the application form and upload their CV.Applications will be open from now until April 15, 2026. After review by the Editorial Board, you will be contacted via email or phone on acceptance.(扫码填表)链接:https://tcnfzobsuhcl.feishu.cn/share/base/form/shrcnH3QNjwQqL5qaxf7xfHGuOc光电进展Opto-Electronic Advances (OEA,光电进展) 是一本同行评议的英文学术月刊,创刊于2018年3月,已被SCI、EI、Scopus、DOAJ、CA和ICI等数据库收录,影响因子22.4,位于JCR Q1区,中科院一区(2025版),入选中国科技期刊卓越行动计划二期英文领军期刊项目。由中国科学院主管,中国科学院光电技术研究所主办并出版,面向全球发行。OEA主要报道光电领域的前沿创新科研成果。期刊栏目包括原创论文、综述和快讯等,欢迎投稿!投稿地址:https://mc03.manuscriptcentral.com/oea期刊官网:https://www.oejournal.org/oea联系邮箱:oea@ioe.ac.cn光电期刊集群Opto-Electronic Journals Group敬请关注www.oejournal.orgOE光电开放投稿总览学科发展ROE光电评论新刊筹备汇集综述评论OEE光电工程提能拓展计划中文核心SCOPUS关注工程应用OEA光电进展卓越行动计划SCI, EIJIF 22.4引领创新前沿OES光电科学卓越行动计划ESCISCOPUS面向基础科学OET光电技术卓越行动计划开放投稿聚焦核心技术OEP光电+英文新刊开放投稿学科交叉融合IOE智能光电英文新刊开放投稿携手智能科技OED光电发现英文新刊开放投稿探索生命与自然OEM光电制造英文新刊开放投稿引领先进制造编辑 | 彭诗涵 张诗杰审核 | 杨淇名转载或合作请联系:gdgc@ioe.ac.cn

来源:光电期刊发布时间:2026-04-01
新款光频梳:巴掌大小,10⁻¹⁸精度

近日,光维科技正式发布其全新产品——HandyScale-Lite全窄锁便携光频梳。同时,即日起所有订购这款新品的单位与合作伙伴,可享七折限时特别优惠。HandyScale-Lite便携式全锁定光频梳在极小的SWaP(体积、重量、功耗)内实现了旗舰级的技术指标,核心参数与百万元以上的机柜式光频梳产品相当,偏频和光外差拍频的秒稳均达到环内10-18量级,打破了传统光频梳在小型化、高性能、低成本的“不可能三角”,大幅助力光频梳走出实验室,成为真正的工业级产品,在更多元化的场景下实现长度、时间、频率、光谱等物理量的精密测量。该产品集成了射频锁定、光频窄锁与双光梳同步锁定三种可软件切换的锁定模式,实现了从绝对频率稳定、极低相位噪声到极低脉冲时间抖动的光频梳性能,能够为光生超稳微波、光钟比对、高精度时频传递及可搬运双光梳光谱仪等前沿科研与工业应用,提供解决方案。产品特点光机电软全功能一体机:一键启动 | 锁定模式切换极致SWaP:超小体积(<3 L)|超轻质量(<3 kg)|超低功耗(<30 W)旗舰级指标:fceo&fbeat环内E-18级秒稳|0.1 rad相噪积分|100~400 MHz可选重频|全保偏光纤NALM锁模实机测试视频①单光梳自动启动+模式切换②双光梳相干锁定+干涉采样联系方式采购请联系光维科技官方渠道:孙先生15201611944(微信同号)关于光维科技光维(广东)科技有限公司是一家专注于光频梳精密测量仪器研发的高新技术企业,核心技术源于清华大学精密测试技术及仪器全国重点实验室的科技成果转化。2024年,公司引入清华大学知识产权增资入股,构建了深度产学研融合的创新体系。光维科技具备全链条自主研发生产能力,产品涵盖飞秒激光器、飞秒光频梳、双光梳绝对测距仪等核心设备。相关成果已应用于卫星基线高精度测量、大型空间相机变形监测等国家重大任务;荣获中国计量测试学会科技进步一等奖、中国机械工业学会科技进步特等奖、中国光电仪器品牌榜“金燧奖”金奖等荣誉。来源:光电汇OESHOW如有光学论文写作/实验笔记经验、绘图工具介绍,或其他优质稿件,欢迎投稿至ioptics@clp.ac.cn。字数控制在2000-3000字为佳,稿件一经录用,我们将提供具有竞争力的稿酬。期待你的来稿!END由于微信公众号试行乱序推送,您可能没办法准时收到“爱光学”的文章。为了让您第一时间看到“爱光学”的新鲜推送, 请您:1. 将“爱光学”点亮星标(具体操作见文末)2. 多给我们点“在看”点在看联系更紧密

来源:爱光学发布时间:2026-03-31
可见光-近红外二区单像素显微成像系统,实现生物组织“表面-深层”协同观测 | 中国激光·封面

《中国激光》2026年第3期封面文章来自西安电子科技大学计钟副研究员、刘于金副教授、陈雪利教授团队受邀撰写的“可见光-近红外双波段单像素显微成像系统”。研究基于傅里叶单像素成像技术,通过分时复用探测设计,成功克服了宽光谱跨度下的信号采集难题,为深层组织观测提供了一种高性价比的“表面-内部”一体化显微成像方案。封面解读封面展示了基于单像素探测的可见光-红外双波段显微成像方法。画面下方展示的网格状器件为数字微镜器件(DMD),作为系统的空间光调制元件,其将傅里叶基底图案转化为结构化光场并投影至待测样本。光束经精密光学元件引导,体现了系统采用分时复用设计实现可见光与近红外二区波段的探测。右上方的生物细胞图像形成了对比:左侧蓝色影像反映了可见光波段下高对比度的表面轮廓与纹理特征;右侧紫色影像则利用近红外二区光线优越的组织穿透性,揭示了被表层遮挡的深层结构信息。该封面展示了系统在计算成像技术支撑下,实现“表面-内部”协同观测的技术优势。原文链接:计钟,杜凯兴,万红玲,张志勇,刘于金,陈雪利. 可见光-近红外双波段单像素显微成像系统(特邀)[J]. 中国激光,2026,53(3): 0307101研究背景显微成像技术是观测微观世界、研究生物组织结构的关键手段。然而,传统的面阵列探测器(如CCD或CMOS相机)面临着波段局限与成本压力,即硅基探测器在可见光波段表现优异,但在近红外波段响应效率极低;若采用高性能的近红外二区面阵相机,其高昂的造价又使得相关技术难以普及。此外,在单一系统中实现多波段成像通常需要复杂的光路切换,易引入机械误差。单像素成像(SPI)技术凭借单点探测器即可实现二维成像的独特性,不仅显著降低了硬件成本,更利用其极宽的光谱响应特性,为低成本、跨波段的显微探测提供了全新的解决思路。创新工作西安电子科技大学研究团队针对深层组织观测需求,设计并搭建了一套基于傅里叶单像素成像(FSI)的主动式双波段显微系统。如图1所示,该系统采用主动投影式的透射显微成像架构,核心在于利用DMD进行空间光编码,通过分束器引导信号光至硅探测器与铟镓砷探测器,实现从可见光到近红外二区的分时复用采集。这种架构避免了昂贵的面阵列相机,大幅简化了光路结构。图1 可见光-近红外二区双波段单像素显微成像系统光路示意图为了确保成像的准确性,研究团队首先对核心探测元件进行了性能表征。如图2所示,硅探测器与铟镓砷探测器在各自波段内均表现出良好的线性光电响应,但其响应带宽的限制在高速采样下会引发信号滞后。鉴于此,团队在探测器后端引入了高性能信号放大器。如图3所示,在10000 pattern/s 的高投影速率下,引入放大器前的畸变信号被修正为锐利的“方波”特性。这一优化显著提升了系统对光强变化的瞬态跟随能力,为高速、高质量成像奠定了物理基础。图2 硅探测器与近红外铟镓砷探测器的光电响应及响应时间表征图3 10000 pattern/s 高速投影下引入放大器前后的信号与成像质量对比在实际显微应用中,物镜倍率对信号强度的影响至关重要。研究团队定量分析发现,随着物镜倍率增加,系统视场急剧收缩,导致探测器接收到的总光通量显著减弱(如图4所示)。因此,在实际观测中需根据样本特性平衡放大倍率与信号强度。随后,利用标准分辨率测试板对系统进行了量化评估。结果显示,在 60×物镜下,可见光与近红外波段的实测最高分辨率均达到了280 lp/mm,如图5所示,验证了该系统在双波段下均具备出色的解析能力。图4 不同放大倍率(10×、20×、40×和60×)物镜对应的采集信号强度对比图5 可见光与近红外波段分辨率板成像结果对比最后,团队通过典型生物样本验证了系统的多波段成像优势。在百合子房切片实验中(图6),可见光波段凭借高对比度捕捉到了精细的细胞壁边缘,而近红外光则展示了由组织密度差异引起的透射纹理。在蚂蚁标本实验中(图7),近红外光的穿透性优势得到体现:原本在可见光下呈强吸收、暗视觉效果的几丁质外骨骼,在近红外二区模式下变得“透明”,清晰揭示了被外骨骼遮挡的内部关节结构。这种“表面-内部”互补的定量成像能力,充分展示了该系统作为深层组织分析工具的应用潜力。图6 百合子房切片的双波段显微成像演变过程与定量分析图7 蚂蚁标本的双波段显微成像过程与定量分析总结与展望本研究构建了一套跨越可见光至近红外二区的双波段单像素显微成像系统,通过计算成像方法解决了高性能红外探测器成本高昂的难题。实验证实,系统不仅具备高空间分辨率,更展现了卓越的组织穿透能力。未来,研究团队将进一步结合深度学习算法开发欠采样重构模型,旨在提升成像速度并拓展光谱探测维度,推动该技术在临床医疗、无损检测等领域的广泛应用。通信作者简介计钟,西安电子科技大学“华山学者”菁英副教授,副研究员,博士生导师,西电广研院先进医学影像团队师生联合党支部书记。长期从事单像素成像以及单像素探测器技术研究,获得陕西省高层次人才、陕西省高层次创新创业人才等省级人才称号,获批主持国家自然科学基金(面上、青年)等多项国家级项目,主持国家重点研发计划子课题1项,以第一或通讯作者(含共同)发表SCI论文30多篇,总被引次数达2000余次(Google Scholar),H因子27。刘于金,西安电子科技大学“华山学者”准聘副教授,硕士生导师。长期致力于新型单像素成像探测器研究,在新型半导体光电探测器件设计、光电器件物理、智能光学成像系统和嵌入式AI方面积累了丰富的技术和经验。主持国家自然科学基金青年项目、中国博士后科学基金特别资助项目,入选澳门青年学者计划、陕西省秦创原引进高层次创新创业人才项目。以第一或通讯作者身份在Light Sci Appl、Adv Mater 等期刊发表SCI论文29篇,申请/授权国家发明专利6项。陈雪利,西安电子科技大学“华山学者”领军教授、博士生导师,生命科学技术学院党委委员,生物医学工程学科方向负责人、先进诊疗技术与装备陕西省高等学校重点实验室、入选国家级科技创新领军人等。主要从事基于光-声-磁的先进诊疗技术与装备及其应用研究,主持国家重点研发计划课题(2项,仪器研发类)、国科金重大科研仪器研制项目课题(结题优秀)、国科金面上项目(3项)、霍英东青年教师基金、国家级/省部级/省级人才项目等16项。以第一或通讯作者发表Sci Adv、Cell Rep Med、Nat Commun 等SCI论文100余篇;授权美国专利2项,中国发明专利17项,转化/许可9项。期刊简介《中国激光》是全面报道激光技术领域最新研究成果的旗舰级中文学术期刊(半月刊)。目前被EI、ESCI、AJ、CA、INSPEC、Scopus、CSCD等收录。根据《中国科技期刊引证报告》显示,《中国激光》综合评价总分在本领域内连续多年排名第一。17次被评为“百种中国杰出学术期刊”(获得次数最多的光学期刊)、6次入选“中国精品科技期刊”、2次荣获“百强报刊”称号,并多次获得“中国最具国际影响力学术期刊”和“中国国际影响力优秀学术期刊”等荣誉。2021年荣获“第五届中国出版政府奖”期刊奖提名奖。2022年入选《光学工程和光学领域高质量科技期刊分级目录》“T1级”、《无机非金属材料领域高质量科技期刊分级目录》“T1级”。2024年入选中国科技期刊卓越行动计划项目——领军期刊。如有光学论文写作/实验笔记经验、绘图工具介绍,或其他优质稿件,欢迎投稿至ioptics@clp.ac.cn。字数控制在2000-3000字为佳,稿件一经录用,我们将提供具有竞争力的稿酬。期待你的来稿!END由于微信公众号试行乱序推送,您可能没办法准时收到“爱光学”的文章。为了让您第一时间看到“爱光学”的新鲜推送, 请您:1. 将“爱光学”点亮星标(具体操作见文末)2. 多给我们点“在看”点在看联系更紧密

来源:爱光学发布时间:2026-04-01
LightCounting报告发布:2030年AI集群光互连市场将达1000亿美元?

LightCounting发布2026年3月版《以太网光模块报告》这不是笔误。到2030年,AI集群中使用的光互连年销售额有较大概率达到1000亿美元。不过,要实现这一目标,需要诸多“条件恰好同时满足”。2024年,以太网光模块的销售额翻了一番,2025年又增长了70%,超出了我们的预期。InP激光器供应商在去年增加了产能以满足不断增长的需求,目前,这些器件以及光模块制造中使用的许多其他器件的短缺情况正在缓解。2026年将有足够的产能来支持光模块销售额翻倍,但这将超出客户的实际需求。XPU和交换机ASIC的短缺将限制2026年AI集群的扩张,这应会使得光模块销售额的增长“仅”为60%,除非客户为未来建立深度库存储备。2027年至2031年的市场增长存在更多不确定性。如下图所示,2027年及以后,“高速增长”可能会持续。2004年至2025年光模块销售的历史数据显示出一种周期性模式,即2-3年的增长期之后会出现一个持平或负增长的年份。大多数周期都是由供应链再平衡导致的,我们可能会在2027-2028年看到类似的情况。我们的预测倾向于“软着陆”情景,但供应链的平衡往往是通过市场修正来实现的——即“颠簸前行”情景。AI集群中的光互连面临几大利好因素。更大的集群将需要每个GPU配备更多的光模块——在横向扩展网络中,每个GPU最多需要6个光模块。光互连中的纵向扩展网络所需带宽几乎是横向扩展网络的10倍,为供应商开辟了另一个细分市场。然而,结合市场的历史数据来看,“高速增长”情景仍然显得不切实际。有人认为,AI热潮已经改变了一切,市场历史可以忽略不计。然而,目前四大云公司(亚马逊、谷歌、Meta和微软)在AI光模块上的支出,占据了整个AI光模块市场总开支的50%以上。而在2018至2023年期间,这四家公司也同样占据了以太网光模块销售额的40%以上。历史或许不会重演,但可能会有相似之处。下表总结了可能影响2026-2031年市场的关键因素,以及需要多大程度的变化才能使天平向两种增长情景之一倾斜。实现“高速增长”情景需要诸多“条件恰好同时满足”,但其中任何一个因素,都可能将市场推向“颠簸前行”情景。本报告分析了不断增长的数据流量以及数据中心架构的变化对以太网光模块市场预测的影响,重点关注用于AI集群的高速模块。报告利用以太网模块出货量的广泛历史数据,结合深入的市场研究,预测了2026-2031年这些产品的销售额。预测涵盖超过100个产品类别,包括100GbE、200GbE、400G、800G、1.6T和3.2T的时钟数据恢复光模块、LPO/LRO以及CPO/NPO,并按传输距离和封装形式进行分类。请订阅用户登录官网获取报告全文:?https://www.lightcounting.com/login

来源:LightCounting Market Research发布时间:2026-04-01
袁菁/骆清铭团队 Nature Photonics | 三维超分辨的数字阵列调制显微成像技术

Banner本文由论文作者团队投稿导读光学显微镜自诞生以来,一直是生命科学研究的重要工具。然而,衍射极限长久以来如同“紧箍咒”,束缚着科学家对纳米尺度世界的探索。超分辨成像技术的出现打破了这一桎梏,其中超分辨结构光照明显微镜(SR-SIM)凭借其优异的标记兼容性,成为解析细胞器变化机制的利器。然而,自2000年问世以来,SR-SIM在重建图像时易产生伪影、保真度不高的问题便如影随形,成为该技术领域久攻不下的核心痛点。究其根源,在于宽场成像方式所采集的原始图像质量不佳,离焦背景与噪声的干扰在频域重建过程中被进一步放大,从而引入严重的重建伪影,损害图像的真实度与分辨率。为缓解这一问题,现有方案多依赖复杂的数据后处理手段进行修正,但这种“先污染后治理”的思路无法从根本上消除重建伪影来源,改善效果有限,甚至可能引入不真实的图像特征,还使计算流程变得复杂冗长,严重制约了该技术在复杂生物样本中的广泛应用。近日,华中科技大学袁菁教授、海南大学骆清铭院士团队彻底跳出了传统SR-SIM的固有范式,在前期建立的离轴成像框架基础上,提出了一种颠覆性的成像新方法,即数字阵列调制显微镜(DaMo)。该方法通过对天然高斯照明调制叠加虚拟阵列调制,将正弦调制的对比度提升至100%,并首次基于厄米特对称性提出了单频谱重建算法,将重建速度提升两个数量级。基于此,DaMo实现了横向100纳米、轴向300纳米的三维分辨率,信背比提升了3个数量级,更重要的是,它彻底解决了传统方法固有的重建伪影顽疾,真正实现了无重建伪影、高通量、高质量的三维超分辨成像。该成果以长文形式发表于Nature Photonics,题为“Three-dimensional super-resolution imaging with suppressed background via digital array modulation microscopy”。华中科技大学李思洁博士生与金锐博士为并列第一作者,袁菁教授与骆清铭院士为并列通讯作者。鲁梦琦硕士生、张朦博士、魏云飞博士、张湛博士生、郭诗睿博士生、张玉慧教授、龚辉教授以及陆军军医大学张宁博士、王锋超教授为共同作者。小百科1:什么是SR-SIM?SR-SIM的核心思路是利用结构化照明对荧光信号进行调制,借助莫尔效应将样本中原本不可见的高频细节信息搬移到显微镜能够探测到的范围内,再通过重建算法还原出一张分辨率比传统显微镜提升一倍的超分辨图像。相比其他超分辨技术,SR-SIM的突出优点是成像速度快、对样本的光毒性低、荧光标记兼容性好。传统SR-SIM以宽场照明调制与Wiener重建框架为核心解决方案。宽场照明调制是指在照明光路中加入特殊的光学调制器件,使打到样本上的照明光呈现出正弦条纹的分布,从而激发出同样呈正弦变化的荧光信号。Wiener重建的标准流程则是先从采集到的原始调制图像中估算出调制参数,再据此分离出不同频率成分的频谱信息,最后将这些频谱分量移回正确的位置并融合在一起,形成一张完整的超分辨图像。小百科2:SR-SIM为什么会存在重建伪影?传统SR-SIM技术的重建质量受限于原始数据质量,而造成这一问题的根本原因在于,传统方法采用的宽场成像光路,很难有效抵抗噪声和离焦背景的干扰。这些未被调制的干扰信息会带来两方面的负面影响。一方面,它们会导致调制参数估算不准确,使得频谱在分离和融合时出现错误,最终在图像中留下条纹状或蜂窝状的伪影。另一方面,它们会降低调制对比度,导致携带高频信息的有效信号减弱,更容易被噪声淹没,在重建过程中噪声被错误放大,形成类似锤击状的伪影。为了缓解这些问题,现有的SR-SIM技术通常在重建环节中加入多种计算处理手段来改善图像质量。然而,这类图像后处理策略只能起到一定的修正作用,无法从根本上解决因原始图像质量不佳而引发的重建伪影问题。小百科3:什么是离轴成像框架?不同于传统落射式照明成像中照明轴与探测轴共轴的方式,离轴成像框架采用照明与探测轴分离的成像策略。在该框架下,聚焦光斑形成天然的照明调制,阵列探测器捕获其完整的空间分布,在像素层面建立起一一对应的关系。由此,每个探测器像素都与一个特定的照明子区域形成共轭,以固有的离轴方式记录其独特调制的信号。在扫描成像过程中,样本点依次通过各照明子区域,使得单次扫描即可获取时间复用且空间编码的原始数据集,从而为灵活开发新型成像方法奠定了重要基础。一、DaMo技术的三大突破1. 高效的成像范式,调制对比度达100%,获得高质量的原始调制图像传统SR-SIM采用零差探测成像方式,直接记录被正弦调制的荧光图像,其调制对比度的理论上限仅为50%,在实际应用中还极易受到噪声和背景干扰,导致调制对比度进一步下降。DaMo则另辟蹊径,利用线照明的天然高斯分布,结合阵列探测器的数字调制,实现了无需物理器件的100%高频对比度外差探测成像。这一设计将能量最大化分配至高频分量,同时借助线照明的共聚焦效应,从物理底层有效抑制了离焦背景,从根本上消除了伪影的产生来源。2. 极致简化的重建算法,保真度达99%,重建速度提升两个数量级传统SR-SIM采用全频谱重建的方式,计算过程复杂且耗时。DaMo独创的单频谱重建算法,发现了厄米特对称性在SR-SIM重建中的独特价值,首次利用这一固有特性将原本复杂的重建过程简化为线性计算。此外,仅使用高级次频谱参与重建,还可以增强对背景干扰的抑制效果。该算法不仅将重建速度提升了两个数量级,能够在成像的同时完成图像重建,更实现了高达99 ± 1%的图像保真度,确保了成像结果的真实可靠。3. 优异的成像性能,横向分辨率100纳米、轴向分辨率300纳米,实现无伪影三维超分辨得益于上述技术创新,DaMo仅凭横向调制便同时打破了横向和轴向的衍射极限,实现了严格意义上的横向100纳米、轴向300纳米的三维空间分辨率,信背比提升了3个数量级。更重要的是,它无需任何计算增强处理,真正实现了无伪影、高质量、高通量的三维超分辨成像,为复杂生物体系的观测提供了可能。二、赋能生命科学:从活细胞到组织的跨尺度验证DaMo的颠覆性不止于技术参数,更在于其强大的生物学应用潜力。研究团队通过一系列实验,充分展示了这一新方法的独特价值。1. 活细胞:捕捉亚细胞结构的动态瞬间活细胞中肌动蛋白的超分辨成像一直颇具挑战,传统方法难以将微弱的肌动蛋白信号与噪声分离。得益于其超高的图像质量,DaMo成功实现了对U2OS活细胞中肌动蛋白的时序记录,首次观察到丝状伪足延伸并级联融合的动态过程。这些结果充分展现了DaMo解析关键细胞过程中肌动蛋白时空动态的能力。此外,DaMo还具有较低的光毒性,在连续拍摄千余帧后细胞仍能保持活性。图1:时间颜色编码的细胞肌动蛋白动态变化与丝状伪足的级联融合现象2. 细胞涂片:高通量下的细胞周期全景成像传统细胞器动态研究多依赖单细胞长时程观察,需在形态细节与群体统计效力之间权衡,存在采样广度、时间稳定性及实验成本等方面的局限。为此,该研究提出了一种全新的高内涵分析途径,通过对非同步化细胞进行全涂片快照式成像,无差别地获取各阶段具有统计学意义的形态学特征,从而实现高效的周期分析。DaMo用20分钟完成了全涂片万余个U2OS细胞的三色超分辨成像与同步重建,清晰揭示了从纺锤体形成、染色体分离到新细胞形成的完整有丝分裂过程。图2:异步生长细胞的全景式细胞周期超分辨成像3. 组织切片:实现完整小肠切片的跨尺度超分辨成像组织切片的背景噪声更强,整体空间异质性更复杂,对传统超分辨成像技术构成了较大挑战。而DaMo凭借其高质量、高通量的特性,有效突破了这一瓶颈。该工作展示了DaMo对10毫米见方小鼠小肠完整冰冻切片的三通道超分辨成像结果,实现了1.92 TB原始数据的高效采集与在线重建。在此基础上,该工作还对小鼠小肠炎症模型下不同肠段、不同部位的线粒体病变进行了定量统计与分析,充分展现了DaMo在组织水平实现跨尺度、高保真超分辨成像的独特优势。图3:小鼠小肠线粒体的完整切片超分辨成像与病变定量分析三、总结与展望DaMo的问世,为超分辨成像领域提供了一种兼顾分辨率、通量、信背比与普适性的三维成像新范式。它以软硬件协同优化为核心,实现了无需复杂调制器件、无需图像后处理增强的纯净成像路径,打通了从亚细胞器到组织架构的跨尺度观测链路。无论是活细胞、全细胞涂片,还是完整组织切片,该方法都展现出了出色的成像能力。这为生物医学基础研究与临床诊断带来了全新的可能,也让高内涵超分辨成像分析有望在更多科学议题中大显身手。论文信息Li, S., Jin, R., Lu, M. et al. Three-dimensional super-resolution imaging with suppressed background via digital array modulation microscopy. Nat. Photon. (2026).https://doi.org/10.1038/s41566-026-01869-4欢迎课题组投宣传稿请扫码联系值班编辑Banner编辑:赵阳

来源:中国光学发布时间:2026-03-31
章永登 Nature Biotechnology | 一面镜子照亮细胞“微观宇宙”:me4Pi-SMLM实现细胞与组织纳米级三维成像

Banner本文由论文作者团队投稿导读光学显微镜的发展是生命科学研究的基石。然而,传统光学显微镜受制于阿贝衍射极限,其分辨率无法满足在分子层面解析细胞精细结构与动态过程的需求。超分辨荧光成像技术的出现,革命性地突破了这一物理屏障,使得在纳米尺度对细胞进行原位、精确定量研究成为可能。其中,单分子定位显微镜(Single-Molecule Localization Microscopy, SMLM)凭借其卓越的空间分辨率和单分子灵敏度,已成为探索纳米尺度亚细胞结构的核心工具。然而,一个长期存在的瓶颈在于:传统三维SMLM(3D-SMLM)存在分辨率各向异性问题,轴向分辨率通常较横向分辨率低2–3倍。为提升轴向性能,基于双物镜的4Pi单分子定位技术(4Pi-SMLM)通过两个相对放置的物镜实现相干检测,可将轴向定位精度提升约5倍,从而获得10–15纳米的三维各向同性分辨率,并支持在全细胞尺度上对多目标进行成像。尽管如此,4Pi-SMLM的广泛普及仍受限于其仪器结构复杂、对准要求严苛以及高昂的系统成本与维护费用。目前全球仅约10余套此类系统运行于顶尖研究机构,且通常需要专人维护。因此,领域内迫切需要一种既能保持4Pi精度,又兼具低门槛、高稳定性与易用性的新型干涉成像方案。2026年3月31日,西湖大学章永登团队在Nature Biotechnology期刊上发表题为Mirror-enhanced 4Pi single-molecule localization microscopy with one objective enables isotropic nanoscale imaging的研究论文。该研究开发了一种基于单物镜和反射镜的干涉单分子定位显微技术(简称me4Pi-SMLM,即镜面增强干涉单分子定位成像显微镜),在细胞样品中实现了2–3纳米的三维各向同性定位精度,性能媲美传统双物镜架构4Pi-SMLM,同时大幅降低了系统复杂度、维护难度与硬件成本,为纳米尺度生物成像提供了一个易用、稳健的新平台。系统设计与原理me4Pi-SMLM的核心创新在于摒弃了传统的双物镜架构,仅使用单个高数值孔径物镜配合一面位于样品上方的反射镜。激发光经物镜和样品后被反射镜反射,形成轴向驻波干涉图案;借助快速压电促动器毫秒级平移反射镜,顺序采集三幅相位调制图像(相位步进2π/3),实现自参考干涉定位(图1a)。这种设计使me4Pi-SMLM实现了2–3纳米的三维定位精度,相较传统3D-SMLM轴向精度提升约5倍(图1c-d)。相较于传统4Pi-SMLM,me4Pi-SMLM完全消除了上行光路,无需昂贵的物镜配对与复杂的双物镜对准;同时,自参考干涉模式对机械漂移具有天然的低敏感性,极大降低了光路重校准频率。这两方面共同赋予了系统优异的稳定性,并显著降低了控制复杂度、维护难度与硬件成本,使日常运行更加可靠,大幅降低了应用门槛。图1:me4Pi-SMLM原理与性能验证细胞中精细结构解析为验证me4Pi-SMLM在生物样品中的成像性能,研究团队将ALFA-tag/NbALFA体系与speed-optimized DNA-PAINT技术相结合的标记策略,对多种亚细胞结构进行了成像,该策略在解决光漂白问题的同时有效减小了标记尺寸。在对微管的成像实验中,与3D-SMLM相比,me4Pi-SMLM增强的轴向分辨率能更有效地解析单个和成束微管的中空环状结构(图2a-b)。对发光超过10帧的单分子进行统计分析显示,me4Pi-SMLM在光子数约5,500的细胞环境中实现了2–3纳米的三维定位精度(图2c-d)。核孔复合物(Nuclear Pore Complex, NPC)是具有高度有序对称结构的蛋白复合体。人源NPC由约30种不同蛋白质组成,其中结构蛋白Nup96以八重对称的双环形式排列——每个NPC包含32个Nup96拷贝,每个环由16个拷贝组成,相邻分子间的轴向距离仅约3纳米、横向距离约10纳米。这一特征使NPC成为定量超分辨成像中公认的基准模型。本研究使用me4Pi-SMLM对U-2 OS细胞Nup96-ALFA敲入细胞系进行成像(图2e),清晰分辨了NPC的双环结构,轴向截面相较3D-SMLM展现出更优异的解析能力(图2f)。通过粒子平均算法对500个NPC进行三维重构,me4Pi-SMLM几乎解析到了Nup96的全部32个拷贝及相邻蛋白,成像质量媲美传统4Pi-SMLM与埃米级别的MINSTED技术,证明了其优于10纳米的三维分辨率。内质网(ER)是具有复杂三维形态的细胞器,包含管状与片层状结构。me4Pi-SMLM对COS-7细胞内质网的成像显示,其呈现为直径60–100纳米的中空管状网络,以及传统超分辨技术难以分辨的厚度仅30–50纳米的片层结构(图2h)。图2:me4Pi-SMLM解析亚细胞结构双色成像为研究细胞器间的空间互作,多色成像能力至关重要。本研究在me4Pi-SMLM上集成了此前开发的回收荧光(Salvaged Fluorescence)分色技术。同时,为最大程度降低背景,研究进一步改进了Fluorogenic DNA-PAINT技术,并结合纳米抗体进行样品标记。利用单一552纳米激光同时激发AF568/Cy3B或ATTO Rho 11/Cy3B两组染料对,通过光谱分色实现双通道同步采集。采用该策略,me4Pi-SMLM对细胞中的微管与内质网进行双色标记成像(图3a-b),实现了清晰的光谱分离,串扰极低,横向和轴向均清晰分辨了内质网与微管的中空结构(图3c-d)。对内质网膜(Sec61β)与腔(KDEL)进行双色成像(图3e),高分辨率有效区分了这两个紧密相邻的腔室,清晰解析了内质网的不同亚结构(图3f-i)。图3:双色me4Pi-SMLM成像全细胞成像me4Pi-SMLM通过柱面镜引入像散以消除轴向相位模糊,使其适用于较厚样本的成像。为展示全细胞成像能力,研究对小鼠精母细胞核中联会复合体(SC)的支架蛋白SYCP3进行了成像。me4Pi-SMLM在整个细胞核范围内,在各个空间朝向与深度上均清晰揭示了SC的双螺旋特征(图4a-e)。此外,对深度达4.5微米的全细胞线粒体外膜网络进行成像,清晰分辨了线粒体膜轮廓与复杂互连结构(图4f-g)。定量分析确认,在整个成像体积内me4Pi-SMLM保持了3–5纳米的DAFL定位精度与10–15纳米的FRC分辨率。图4:全细胞me4Pi-SMLM成像活细胞成像传统4Pi-SMLM因系统复杂度高、稳定性要求严苛,一直未能实现活细胞成像。me4Pi-SMLM凭借简化的光路、增强的稳定性及对标准共聚焦培养皿的兼容性,首次将4Pi级精度应用于活细胞成像。研究以染料PA-JF549-HaloTag标记U-2 OS细胞系内质网结构,以9毫秒周期时间进行me4Pi-SMLM成像,连续采集10分钟捕捉内质网动态变化。结果以三维40–60纳米的分辨率清晰呈现了细胞外周内质网管状网络的动态过程。研究进一步将me4Pi-SMLM应用于三维单分子追踪,使用更低染料浓度和脉冲激活维持适宜的Sec61β单分子密度(图5h)。以三维6纳米定位精度与9毫秒时间分辨率,揭示了局限于内质网膜内、具有不同迁移率的Sec61β单分子活动。图5:me4Pi-SMLM活细胞成像与单分子追踪脑组织成像使用传统4Pi-SMLM对组织样本进行超分辨成像面临重大挑战:组织中的折射率不均匀性、散射及深度依赖的像差会破坏干涉所需的相位关系,降低成像质量。me4Pi-SMLM采用与单物镜3D-SMLM相当的探测配置,天然更适用于组织成像。研究首先在30微米厚小鼠脑切片中对不同深度处的线粒体外膜蛋白和光遗传学关键蛋白Channelrhodopsin-2(ChR2)进行成像(图6)。在整个组织体积内,观察到了线粒体的多种形态和沿轴突分布的ChR2簇。在约20微米成像深度内,系统维持了约6纳米的DAFL三维定位精度与优于15纳米的FRC分辨率,为神经科学研究开辟了新途径。图6:me4Pi-SMLM脑组织成像总结与展望me4Pi-SMLM在多种复杂生物样品中均展现出卓越的纳米尺度成像性能,将4Pi技术成功突破至活细胞动态成像、单分子追踪与厚组织成像。该技术兼容DNA-PAINT、dSTORM等多种单分子成像模式,成像质量媲美传统双物镜4Pi-SMLM,为纳米尺度的原位生物学研究提供了高精度的观测手段。在性能比肩前沿技术的同时,me4Pi-SMLM大幅简化了系统架构和控制的复杂度,赋予了系统优异的稳定性、更广的样品适配性以及更低的硬件成本与维护门槛。尤为重要的是,me4Pi-SMLM具备卓越的升级兼容性。现有3D-SMLM系统仅需增加一面反射镜与一台低成本压电促动器即可完成改造,无需深厚的干涉成像专业技能或高额资金投入。这一特性使得原本局限于少数顶尖实验室的4Pi级精度成像技术,有望真正走向广泛的生物学研究群体。me4Pi-SMLM为在完整细胞及组织环境中解析纳米尺度的分子结构与动态过程提供了强有力的工具。该技术的推广与应用,将为揭示亚细胞尺度的分子机制与疾病机理开辟更多可能。论文信息Yu, Z., Zheng, B., Zhan, Y. et al. Mirror-enhanced 4Pi-SMLM with one objective enables isotropic nanoscale imaging. Nat Biotechnol (2026). https://www.nature.com/articles/s41587-026-03083-7西湖大学章永登研究员为本论文通讯作者,其团队博士生于紫荆和助理研究员郑贝博士为共同第一作者。助理研究员陈艳琴博士,博士生黎舒馨、韦宗仿,访问学生王旭龙,科研助理占雅静、代秋阳、赵文渲为本研究做出重要贡献。本工作获得西湖大学俞晓春研究员及其博士生陈琳琳、西湖大学刘长亮研究员及其博士生唐嘉欣、西湖大学何灵娟研究员及其博士生夏天畅、西湖大学吴旭冬研究员的支持与帮助。实验室简介与招生章永登团队(https://www.westlake.edu.cn/faculty/yongdeng-zhang.html)长期致力于开发下一代超分辨率荧光显微成像技术,包括4Pi-SMS、4Pi-SIM、4Pi-SIMFLUX及me4Pi-SMLM等,为在纳米尺度阐明亚细胞结构与动态提供系统性工具。实验室长期招收博士后、科研助理及博士研究生,欢迎具有生物医学工程、物理光学、计算机、生物技术、生物化学等相关专业背景的申请者加入。要求具备良好的学习能力、独立工作能力和团队沟通能力。有意者请将个人简历发送至zhanglab@westlake.edu.cn。欢迎课题组投宣传稿请扫码联系值班编辑Banner编辑:赵阳

来源:中国光学发布时间:2026-04-01
对话戴国浩:用Token重新理解AI的成本与价值

近期,DeepTech 密集报道了一系列 AI 在具体场景中落地的新突破。在曼哈顿,一位耶鲁毕业的律师借助 Claude,仅用两小时便完成了传统中型律所团队通宵才能交付的并购提案;一位从未写过代码的管道工程师利用 AI 工具分析诊断数据,在几分钟内锁定了复杂管道网络的故障源,而过去这通常需要高级工程师上门勘测数日;与此同时,开源 AI 智能体项目 OpenClaw 继续以“人类历史上增长最快的开源项目”之势席卷全球,帮助不同行业的从业者实现了更复杂的 Agent 功能。这些故事的共同点显而易见:AI 正在抹平团队与个体之间的产能鸿沟,“一人公司”(One Person Company)不再是愿景,而是触手可及的现实。然而,几乎每一条案例的评论区,都出现了同一种声音:“他们做到这些究竟烧掉了多少 token?”是的,效率的跃升并非毫无代价。作为大语言模型处理信息的最小单位,AI 在具体场景中施展拳脚,离不开海量 token 的消耗。陶哲轩在用 AI 辅助破解数学难题时,首次尝试便因消耗过量 Token 导致本地算力崩溃;据报道,OpenAI 工程师团队一周处理的 token 量高达 2,100 亿,相当于复写 33 遍维基百科;而一些 OpenClaw 的重度用户晒出的算力账单更是惊人,月支出从数千美元到数万美元不等。与此同时,企业界也开始重新审视 token 的稀缺性与战略价值。黄仁勋在近期 GTC 大会上提出了“token 经济学”的概念,他认为数据中心正在演变为生产 token 的“AI 工厂”,token 需要根据相应的标准进行分层定价供给。同时,token 将成为继工资、奖金、期权之后的“第四种薪酬”。在硅谷,工程师的身价评估体系也正在被呼吁重构,其中一项重要标准就是看他能高效调用多少 token。token,这个曾经位于技术文档底部的计量单位,正在跃升为 AI 时代的新货币。它既是生产力的燃料,也是稀缺资源的象征;它既是个体实现能力跃迁的杠杆,也可能成为新的数字鸿沟。为了更深入地解读 token 在 AI 时代的全新意义,我们邀请了上海交通大学副教授、无问芯穹联合创始人戴国浩进行了一次深度对话。他长期致力于稀疏计算与软硬件协同设计方向,研究内容包括结构化稀疏方法、动态编译策略与细粒度并行架构,从而在有限硬件条件下提升算力表现。戴国浩也是 2024 年《麻省理工科技评论》“35 岁以下科技创新 35 人”中国入选者。我们围绕 token 从技术参数向经济变量转化的内在逻辑、底层算力效率的优化路径,也对在个人层面如何更高效地使用 token 展开了讨论。以下是对话内容:DeepTech:token 作为一个概念,过去几年主要出现在技术讨论中,例如推理成本、模型定价。但最近它开始出现在薪酬谈判和企业预算里。在你看来,token 从一个技术参数变成一个经济变量,这个转变的背后发生了什么?戴国浩:我认为最根本的原因在于模型的智能化水平已经达到了“可用”的阶段。如果以 2022 年底 ChatGPT 的发布为起点,到现在大约三年多时间。当时的模型更多还是一个对话系统,虽然具备一定的智能,可以进行自然语言交互,但很难真正嵌入到生产流程中,也无法直接转化为生产力。而现在,一个关键变化在于模型已经具备完成实际任务的能力。也就是说,当用户获得一定的 token 配额后,不再只是与模型进行对话,而是可以通过模型完成具体工作。这种能力的转变,使得 token 不再只是一个技术层面的计量单位,而是成为可以直接对应生产结果的资源。因此,token 从技术参数演变为经济变量,本质上是由模型能力和整体智能水平的提升所驱动的。DeepTech:从理论上看,模型能力的提升通常会带来单位 token 成本的下降。但在现实中,我们看到不少云厂商选择上调价格。同时,随着像 OpenClaw 这类智能体应用的兴起,越来越多用户开始感受到高额 token 消耗所带来的成本压力。你如何看待这种看似矛盾的现象?其背后是供需关系的变化,还是推理成本结构发生了改变,或是其他因素在起作用?戴国浩:我刚才提到模型能力的提升,这实际上意味着“单个 token 的能力”在增强。如果从经济角度来理解,可以将其放入一个更完整的价值转化链条中来看。之所以很多人将 AI 视为“第四次工业革命”,本质上是因为每一次工业革命,都是通过某种关键技术,创造出新的生产力形式。而所有生产力的核心,都是将输入价值转化为输出价值。在传统工业体系中,例如蒸汽机或发电机,提供的是动力或电力,用于将原始物料加工为具有经济价值的产品。而在这一轮 AI 变革中,模型能力的提升,使其本身也成为一种新的价值转换机制。如果将这一过程拆解,可以得到一个相对清晰的链条:输入价值→①→电能→②→token→③→生产力→④→输出价值其中①是供电体系,②是芯片和系统,③是模型和算法,④是社会评价体系输入价值首先是转化为电能,然后电能通过芯片与计算系统转化为算力,算力进一步转化为 token,最后 token 再通过模型转化为生产力;最终,这些生产力通过社会评价体系(例如代码、文本内容等)被赋予具体的经济价值。在这个链条中,token 是一个关键中间环节。随着模型能力的提升,“token 到生产力”的转化效率显著提高。换句话说,每一个 token 所能承载和释放的价值变得更高。这也解释了为什么 token 会具备经济属性。可以类比为企业为员工配备工具:之所以配备计算机,是因为它能够提升生产力,而不是提供一个没有实际用途的工具。同理,当 token 能够直接驱动生产时,它自然会被纳入经济体系。另一方面,“成本下降”更多发生在“电能到 token”的阶段,也就是算力效率的提升,例如硬件优化或系统效率提升。而“token 到生产力”的价值转化,则属于链条中的另一环节。在模型尚不可用的阶段,由于后端价值有限,企业往往需要通过低价甚至补贴来推动使用,包括大规模铺量或持续优化成本结构。但当模型能力提升、后端价值显著提高后,整个逻辑会从“推广驱动”转向“市场化驱动”。在这种情况下,企业需要重新平衡成本与收益,即使技术仍在持续优化、推理效率不断提升,价格上调也是市场化过程中的自然结果。因此,这种“成本下降但价格上升”的现象并不矛盾。本质上,一方面是底层技术效率在提升,另一方面是过去推广阶段所存在的成本缺口逐步被填补,最终形成一个可持续的商业闭环。DeepTech:你的研究方向之一是稀疏注意力(sparse attention)等机制,这类方法会直接影响 token 的计算成本。如果沿着这一思路继续推演,未来模型是否有可能具备“自适应计算能力”,即自动判断哪些 token 需要精细计算,哪些可以简化甚至跳过?这种机制在多大程度上会影响推理成本?戴国浩:从具体技术来看,这种趋势已经在发生,而且不仅限于稀疏注意力。例如,稀疏专家(Mixture-of-Experts)、层级稀疏(layer skipping)、以及模型结构层面的多级配置(如投机解码、大小模型协同),本质上都可以归为“稀疏化”或“结构化”的探索。像 DeepSeek 等团队,已经在稀疏注意力等方向上进行了实践;同时,大规模模型(百亿甚至千亿参数级别)中,稀疏专家结构也已较为常见。此外,一些系统开始引入小模型与大模型协同,通过推测解码(speculative decoding)提升整体吞吐效率。这些方法的共同点在于:通过结构设计,而非单纯增加参数规模,来提升计算效率与性能表现。从更宏观的角度看,智能系统的发展,本质上是在不断逼近“最优结构”。在早期,由于对模型结构理解有限,采用稠密矩阵(dense architecture)是一种更直接、通用的表达方式,通过扩大数据和参数规模来获得性能提升。但随着理解的加深,结构性特征会逐渐显现。例如残差连接(residual connection)、卷积结构(convolution)等,都是在这一过程中被发现并固化下来的有效结构。理论上,任何结构都可以用更大的稠密矩阵来近似表达,但在实际中,这样的模型往往难以收敛,同时计算效率极低,因此并不可行。回到 token 这一中间环节,未来一个重要方向是对 token 进行更细粒度的计算分配。例如,在推理过程中,不同 token 的复杂度是不同的:一些 token 可能只需要较浅层的计算即可得到结果,但另一些则需要更深层、更复杂的计算路径。因此,可以针对每个 token 动态分配计算资源,对其计算深度和计算量进行定制化设计。相比于“所有 token 都经过同样深度模型”的方式,这种方法能够在保证效果的同时显著降低整体计算开销。这也是为什么 token 在当前阶段不仅是计量单位,更是计算调度与资源分配的核心对象,它也将逐渐成为一种关键的生产要素。DeepTech:如果进一步拆解 token 的成本结构,除了模型本身,还包括 KV Cache 的显存占用、带宽,以及芯片架构等因素。在这些层面中,你认为当前优化空间最大的是哪一部分?戴国浩:可以用一个相对简化的模型来描述推理开销:那就是时间 ≈ 计算量 ÷(算力 × 利用率)或者从存储角度来看:时间 ≈ 数据量 ÷(带宽 × 利用率)在这个框架下,不同变量对应不同层面的参与者:首先,计算量主要由模型设计决定,例如参数规模(3B、30B、300B 等);其次,算力取决于芯片能力,例如算力规模(TFLOPS 级别差异);最后,利用率则与软硬件协同优化密切相关。此外,像 KV Cache 的显存占用、注意力计算开销等问题,本质上更多影响的是系统的带宽利用率与整体资源利用效率。芯片本身的能力则与其架构设计和制造工艺有关。在这一建模框架下,可以看到不同优化方向的边界:首先,单纯降低模型计算量的空间其实有限,因为模型发展的首要目标仍然是提升智能水平,这是一个基本前提。因此,在模型设计层面,压缩计算量并不是主要矛盾。相比之下,利用率的优化空间非常大。无论是算力利用率、带宽利用率,还是缓存命中率,都存在显著提升空间。其次,芯片架构本身的设计也是一个重要方向。例如 英伟达黄仁勋 所提出的“AI Factory”理念,本质上是将芯片、系统软件以及电力供给等多个层面打通,进行整体协同优化。总体来看,未来推理成本下降,更依赖于:一个是各层级资源利用率的提升,另一个是芯片架构与系统设计的持续演进。而这些优化的最终目标,都是为了支撑更大规模、更高智能水平的模型发展。DeepTech:那么从当前阶段来看,性能优化的主要瓶颈更偏向算法侧,还是硬件侧?戴国浩:我认为主要瓶颈仍然在硬件,以及硬件与算法的协同设计(co-design)。算法的发展方向始终是探索更高水平的智能,这是不会改变的。但算法的迭代效率,很大程度上受限于硬件条件。例如,一个模型版本的迭代周期是一个月还是三个月,本质上取决于算力资源与系统效率。因此,问题不仅在于是否存在更优的算法,还在于这些算法能否在现有硬件体系下高效实现。目前也有越来越多的团队在尝试算法与硬件的协同优化,但这一过程的效率,仍然受到硬件设计能力以及对硬件理解深度的制约。从这个角度来看,未来的关键竞争点,将越来越集中在软硬件一体化的协同设计能力上。DeepTech:前段时间,黄仁勋在 GTC 大会上提出了一个颇具冲击力的观点:未来员工的 token 消耗量应当与薪酬成正比,可以将 token 使用量视为生产效率的一种指标。与此同时,硅谷也出现了一种被称为“tokenmaxxing”的现象:一些从业者会刻意提高 token 使用量,用不完甚至会产生焦虑。你如何看待这一观点?无论是企业还是个人,应该建立怎样的“token 观”?戴国浩:我倾向于从辩证的角度来看。首先,我可以理解他为什么会提出这样的观点。结合他所强调的 AI Factory,本质上是在将算力体系转化为“token 的生产系统”。在早期,当 AI 尚未形成完整的正向经济循环时,GPU 只是数据中心或算力基础设施中的一个组件,是供应链的一环。但当 AI Factory 的概念成立之后,这套系统更像是一个“token 生产工厂”。如果进一步类比,可以将其视为一种“价值生成装置”。在一种极端设想下,如果 token 的消耗可以直接映射为经济回报,那么这套系统就具备类似“价值生成器”的属性。另一方面,我认为这一观点也具备一定合理性。因为从工具属性来看,可以类比为早期的软件工程实践。例如在十年前,程序员的产出有时会通过代码量进行粗略衡量。代码量在某种程度上反映了工具使用的强度和产出规模。在今天,token 消耗可以被理解为一种新的“工作投入度量”。你使用了多少 token,某种程度上意味着你调用了多少模型能力,完成了多少任务。因此,它与产出之间确实存在一定相关性。但问题在于,这种关系并不是线性的,也不是稳定的。如果回到我们前面讨论的价值转化链条,token 只是其中的一个中间环节。“token 到生产力”的转化效率,取决于多个因素:例如使用的模型能力,模型之间的协同方式,token 的质量(例如 prompt 质量),或者是具体任务类型。因此,我认同 token 消耗量与价值之间“存在相关性”,但更关键的是:如何使用 token。换句话说,高质量地使用 token(例如选择合适模型、设计有效结构),比单纯增加 token 消耗更重要。这可能才是未来个体需要重点关注的能力。DeepTech:那是否有可能存在一个更合理的指标,而不是简单用 token 消耗量来衡量生产效率?戴国浩:如果在理想情况下,“token 到生产力”的转化关系是标准化的,例如一个 token 可以稳定对应某种经济价值,那么确实可以直接用 token 消耗来衡量产出。但现实中,这一环节并不稳定,尤其是在当前阶段。对于一些高度标准化、确定性较强的行业(例如部分法律、会计等场景),随着工具成熟,未来可能逐步接近这种“线性映射”。在这种情况下,将 token 使用量与产出挂钩,是可以成立的。但对于更具创造性的工作,这种关系往往是非线性的。例如,有的人可能只使用较少的 token,就能产生更高价值的结果;而另一些人即使消耗更多 token,产出价值却未必更高。在这种情况下,更合理的评价方式,应该是将token 使用量”与“最终产出价值”进行联合评估。从资源配置角度看,我们更应该鼓励的是:用更少的 token 产生更高的价值。这也可以理解为一种更正确的 token 观。DeepTech:在最近的趋势中,我们发现了许多使用者尤其关注一个问题:在实际使用大模型时,如何更高效、更具性价比地使用 token?你作为专业的从业人员,在日常使用中,有没有一些经过验证的方法或经验,比如在 prompt 设计、任务拆解、模型选择等方面?戴国浩:这三个方面,其实都非常关键。可以用一个类比来理解:在传统的软件团队中,通常会有架构师和程序员的分工。程序员负责具体实现,而架构师负责整体设计,包括任务拆解、模块划分以及协作方式。从当前大模型的能力来看,它已经可以高效完成很多“程序员层面”的执行工作,这一点并不困难。真正的挑战在于更上层的结构设计。具体来说,可以对应三个关键环节:第一是任务拆解。需要将一个复杂问题分解为多个子任务,并明确各自的边界与目标。第二是 prompt 设计。本质上是对任务目标的精确表达,相当于对执行单元的“指令定义”。第三是模型选择与调度。即让“合适的模型做合适的事情”,例如简单任务可以交给轻量模型处理,复杂任务再调用更强的模型。这三个环节,实际上构成了一个完整的“结构设计过程”。此外,还有一个容易被忽视的点:人类输入的 token 往往更高效。在一些推理型模型中(例如带有长链路思考过程的模型),模型在内部会生成大量中间推理步骤,这些过程本身会消耗大量 token。而人类可以在前置阶段,通过更清晰的任务定义,减少模型不必要的探索路径,从而降低整体开销。结合这些经验,我个人的使用方式是:先尽可能在前期将 prompt 定义得清晰、具体;然后,对任务进行结构化拆解;最后,在不同复杂度任务之间,灵活选择模型(包括开源模型与高性能闭源模型的组合使用)。从长期来看,这也意味着一个能力转变。以程序员为例,需要逐渐从单纯的“编码者(coder)”,转向“系统架构设计者(architect)”。只有在更高层面进行结构设计,才能真正提升整体效率。DeepTech:黄仁勋在会上还提出了 token 的分层定价策略,沿着"模型智能程度 × 生成速度 × 上下文长度"三个维度来定价,形成从免费层到高速层 $150/百万 token 的供给体系。在这方面,一些国内公司已经相继响应。你认为这一框架对产业格局会产生怎样的深层影响?它是否会加速大模型市场的两极分化?戴国浩: 刚才你提到的几个关键变量,包括模型智能水平、生成速度和上下文长度,其实可以归为两类,并分别对应我们之前讨论的价值转化链条中的不同环节。其中,生成速度和上下文长度,主要影响“算力到 token”的转化效率。这一部分与计算能力和存储能力密切相关:上下文长度更多涉及存储与带宽,生成速度主要与计算能力相关,同时也受到访存效率的影响。模型的智能水平,则对应“token 到生产力”的转化效率。从这个角度看,这三个变量实际上构成了整个价值链条中的关键维度。因此,将 token 按不同能力层级进行划分,本身是有内在合理性的。进一步来说,不同行业、不同任务,对 token 的“价值密度”要求是不同的。高质量 token(例如由更强模型生成)在某些场景中能够产生更高价值,因此在定价上进行分层,是符合基本经济逻辑的。至于具体的定价策略,我并不是这方面的专家,但从一般规律来看,一个比较普遍的现象是:价值越高的产品,其“性价比”往往反而越低。这一点在很多行业中都存在。例如汽车、手机等领域,高端产品通常在绝对性能上更强,但单位性能的价格也更高。这样的结构并不会导致行业失衡,反而使不同需求的用户,都可以在同一价值链中找到适合自己的选择。如果将 AI 视为一种逐渐成熟的“商品”,那么类似的分层定价体系,大概率也会自然出现。DeepTech:但 token 作为一种相对新的“商品”,用户在理解和接受它的过程中,可能还需要时间。它不像传统行业那样已经形成稳定认知。戴国浩:是的,一方面是认知上的适应过程,另一方面,技术本身仍处在快速发展阶段。AI 在未来会在更多行业中释放价值,但目前仍处于一个早期拐点阶段。已经开始在部分场景中形成明确价值,但整体渗透率还不高。如果回看三年前,以对话系统为主的模型确实很难直接产生经济价值,而现在情况已经发生了明显变化。DeepTech:当前的云计算基础设施,本质上是为人类工程师设计的,而不是为 agent(智能体)设计的。在这种情况下,这套架构是否在一定程度上限制了 token 效率的进一步释放?如果以“token factory”为目标推进,你认为从硬件、软件到调度和服务,各个层面需要进行怎样的重构?这种变化会有多激进?戴国浩:这个问题也可以从生产体系演进的角度来理解。如果把 token factory 类比为一种新的“工厂”,那么它和传统的电厂或水厂类似,本质上是在生产基础资源。回看工业发展历程,每一次工业革命都会引入新的基础生产要素,从蒸汽到电力,再到信息计算能力,而每一次这种变化,都会带来整个系统结构的重构。从这个意义上看,以 token 为代表的大模型体系,正在成为一种新的基础生产要素。虽然它目前仍建立在既有的电力和信息系统之上,但随着其重要性不断提升,底层架构发生系统性变化是一个必然趋势。外界对 token 有不同的类比,比如把它看作比特,或者类比为电力,这些说法各有其合理性。但更关键的一点在于,当 token 成为核心生产单元之后,整个系统的各个层级都会围绕它进行重新组织。最先发生变化的,往往是接口层——如果 token 成为统一的计量单位,那么系统之间的交互、任务的度量、甚至算力与电力的转换关系,都可能逐渐以 token 为核心来表达。当然,这一判断隐含了一个前提,即当前以 Transformer 为基础、以 token 为核心处理单元的范式在一段时间内是稳定的。从目前来看,这一方向具有较高确定性,但仍然存在技术演进的不确定性。在这个前提下,各个层面的变化其实已经在发生。以芯片为例,像 NVIDIA 的 GPU 架构,虽然仍然是通用计算架构,但在数据中心场景中,已经引入了大量针对 Transformer 的专用计算单元。本质上,这些优化都是在围绕 token 的处理效率展开。整个过程是渐进式的:从最早的通用计算,到针对矩阵运算的加速,再到专门为 Transformer 结构优化,逐步向 token 对齐。类似的趋势,也会在软件、调度乃至服务层逐步体现出来。DeepTech:如果整个体系都逐步对齐到 token,本质上意味着默认的计算范式仍然是以 Transformer 为基础。但我们也看到一些新的架构在出现,比如 Mamba,或者扩散模型在语言建模中的尝试。你觉得如果这些技术发展到某个阶段,token 是否可能被替代,或者演化成新的计算单元?戴国浩:这个问题可以分两个层面来看。在中短期内,一种范式是否会被替代,关键不在于它“是否更好”,而在于它是否能在整体效率上实现数量级的提升。因为现有体系不仅仅是技术本身,还包括完整的工业基础、软件生态以及价值评估体系,这些都是高度固化的,切换成本非常高。往往需要展现出一个数量级的提升的潜力,才有可能推动技术的汰换迭代。目前确实出现了一些新的架构,比如 Mamba,以及基于扩散过程的语言模型。这些方法在某些特定任务上可能表现更优,但从整体来看,一方面还缺乏大规模工程验证,另一方面也很难在短时间内嵌入现有体系。更重要的是,它们在实际落地时,仍然需要与现有接口对齐,最终输出依然是 token 序列。因此,从现实路径来看,这些技术更像是在现有范式内部进行优化,而不是直接替代。如果把视角拉得更长远,确实存在一种可能性,即未来出现完全不同的计算范式,例如连续计算甚至量子计算。这类体系一旦成立,可能会从根本上改变当前以离散 token 为基础的计算方式。但同样,它必须在关键效率指标上显著优于现有体系,才有可能推动整个产业迁移。在当前阶段,我更倾向于认为,这样的范式转变还需要较长时间。更现实的问题仍然是,在以 token 为核心的既有体系中,如何持续提升转化效率,以及如何完善整个基础设施和应用生态。这可能才是当下更关键的方向。运营/排版:何晨龙

来源:DeepTech深科技发布时间:2026-03-31
陶哲轩最新论文:拒绝技术至上,AI 需要以人为本被重新定义

昨天,陶哲轩在他的个人博客上发布了一则论文更新。他在贴文中写道,“我很少写哲学性质的长篇文章,上一次大概是 2007 年。”这位菲尔兹奖得主、加州大学洛杉矶分校数学教授,刚在 arXiv 上传了一篇题为《人工智能时代的数学方法与人类思维》(Mathematical Methods And Human Thoughts In The Age Of AI) 的论文,论文的合著者是他的多年好友、跨学科学者 Tanya Klowden。陶哲轩还补充道,这篇论文的撰写耗时超过一年,或许这听起来和当今人工智能的发展速度相比有些滞后。但他们想跳出当下人工智能与形式化工具带来的具体技术问题,而是想把视角聚焦在 AI 与人类智能关系的深度思考:他们的话题非常的广泛,从古希腊的欧几里得讲到当下的大语言模型,从数学证明的“气味”谈到十九世纪卢德分子砸毁纺织机的往事。论文将作为即将出版的《布莱克威尔数学哲学指南》中的一个章节。(来源:陶哲轩个人博客)过去两年,陶哲轩对 AI 工具的态度经历了一次公开的转变。在2024 年,他曾把使用 AI 做数学比作“指导一个平庸但还算有点能力的研究生”。而到了 2026 年 2 月初,在 UCLA 举办的一场名为“用 AI 加速数学与理论物理”的会议上,他的措辞变成了“AI 现在可以正式上场了”,因为它“节省的时间已经超过了它浪费的时间”。但陶哲轩并没有因此变成技术乐观主义的布道者。他依然站在“人”的这一侧。这篇新论文试图回答的问题是:当 AI 可以生成外表光鲜、逻辑上无可挑剔的数学证明时,我们还需要人类数学家做什么?更广泛地说,当 AI 开始自动化创造过程本身,不只是通讯、计算、排版这些辅助环节,我们该如何重新定义智识工作的价值?论文的核心论点可以概括为一句话:AI 是人类工具演进的自然延续,但它的发展必须以人为中心。这听起来像是一句正确但空洞的口号,但陶哲轩和 Klowden 花了相当篇幅来解释他们所说的“以人为中心”具体意味着什么。首先是关于数学证明的“气味”问题。这里的“气味”可以理解成一种直觉性的体验,任何一个有经验的数学家在阅读一篇论文时,往往在逐行检查之前就已经对论证的可信度有了直觉判断。这种直觉来自于证明是否提供了“理解”,不只是显示假设蕴含结论,还能解释为什么这种蕴含是可能的,哪些步骤是关键的,哪些是常规的。论文引用了著名数学家瑟斯顿(William Thurston)的观点:好的证明不仅正确,还要提供洞见。问题在于,当前的形式化验证系统(如 Lean 或 Rocq)只能检查证明的逻辑正确性,无法捕捉这种“气味”。一个 AI 可能产出“无味”的证明,在技术上完美无瑕,却让读者感到莫名不满,因为它没有告诉你任何关于更广泛数学领域的信息。2024 年国际数学奥林匹克(International Mathematical Olympiad,简称 IMO)上,DeepMind 的 AlphaProof 系统解出了包括最难的第六题在内的三道题目,获得银牌水平的成绩。但陶哲轩在论文中指出,那些 AI 生成的证明“包含大量冗余或难以解释的步骤”,尽管它们都通过了 Lean 的形式化验证。这就引出了论文的第二个关键论点:形式化验证是必要的,但远远不够,翻译错误的风险始终存在。费马大定理陈述中隐含的假设是自然数从 1 开始而非从 0 开始,一个不加注意的 AI 可能因此“证明”费马大定理是错的。更微妙的是,即使在纯粹抽象的数学领域,只有一部分论证可以被形式化;围绕这个核心的是一圈启发式、经验性、元数学的推理,这些推理提供了关于论证为何有效、是否可推广、动机何在的宝贵信息。这些问题在数学领域已经足够复杂,推广到现实世界就更加棘手了。论文用了相当篇幅讨论 AI 的社会成本:数据中心的能源和水资源消耗、入门级工作岗位的消失、训练数据的知识产权争议、以及“数字鸿沟”。不仅是有 AI 和没有 AI 的人群之间的差距,还包括被锁定在不同 AI 生态系统中的研究者之间能力的不均衡。Tanya Klowden 的加入则让论文有了更加广泛的关切。图 | 陶哲轩与 Tanya 合照(来源:Instagram)她的背景颇为丰富精彩:首先是物理学硕士(研究课题是石墨烯的催化刻蚀)、艺术史硕士(研究 16 世纪西班牙宫廷肖像画中的合作关系),曾是舞台设计师,现在是伦敦考陶尔德艺术学院的博士研究生。陶哲轩在博客中称她为“博学者”(polymath),两人还合作撰写了一本关于天文学距离阶梯的科普书籍,即将由耶鲁大学出版社出版。这种跨学科的组合使得论文能够在技术细节和人文关怀之间自如切换:从 Lean 证明助手的语法讲到十九世纪诺丁汉纺织工人的绝望反抗。论文中有一个引人注目的类比,现代 AI 的出现类似于天文学中的哥白尼革命,这在陶哲轩在近日接受 Dwarkesh Podcast 采访也有所提及。在古代地心说模型中,地球享有宇宙中心的特殊本体论地位;历经几个世纪的天文学和物理学进步,这种特权被逐步瓦解,取而代之的是哥白尼原理。地球只是无数行星中的一颗,不受自然法则的任何特殊对待。类似地,人类智能长期以来被视为认知宇宙的中心,但现在我们正在发现(或创造)其他与我们在很多方面可比但又截然不同的“智能行星”。(来源:Youtube)这个类比的微妙之处在于:接受地球在宇宙中的平凡地位,并不妨碍我们继续高度关心地球上发生的事情。同样,承认人类智能不再是唯一的智能形式,也不意味着我们要放弃对人类认知活动的重视。论文引用了国际象棋的例子:自从 1990 年代人类棋手再也无法战胜象棋引擎之后,国际象棋非但没有消亡,反而作为一项人类活动继续繁荣。棋手们把引擎整合进训练中,用它来重新审视旧理论、探索新战术、寻找即使是“不可战胜”的 AI 也可能存在的弱点。但论文也承认,这种乐观的共存场景有赖于一些条件,而这些条件目前远未得到满足。作者们明确拒绝了三种极端立场:纯粹形式主义(只要符号操作正确就行,不需要理解),人类沙文主义(人类创造力有某种不可言喻的特质是 AI 永远无法复制的),以及 AI 至上主义(人类认知活动是一种苦差事,应该尽快被自动化取代)。他们认为,在这些极端之间存在哲学上的中间地带,可以为人与 AI 之间的互补共存提供有用的视角。具体到当下的实践建议,论文提出了一个逐步演进的框架。短期内,AI 应该像烘焙中的香草精,适量添加可以提升风味,过量则会毁掉整道菜。中期内,AI 适合扮演“红队”角色,负责测试、验证、检查人类生成的内容,但不应该在“蓝队”,即核心创作环节和承担结构性职责。至于长期,论文只是提出了问题而没有给出答案:如果未来某一天,AI 在所有实际维度上都超越了人类专家,我们将如何应对那些关于智识劳动价值的根本性哲学问题?陶哲轩在 Dwarkesh 那里接受采访时曾说,他在 2023 年预测“到 2026 年 AI 将成为数学研究中值得信赖的合著者”,现在他对这个预测感到满意。但他也坦言,AI 让他的论文更丰富了,核心突破仍然要靠纸笔完成。AI 擅长广度,人类擅长深度,二者高度互补;他认为人机混合将在数学领域占据主导地位的时间会比很多人预期的更长。论文的最后一部分坦率地讨论了知识产权和责任归属的困境。当 AI 被应用于一个问题时,谁对错误负责?谁获得洞见的荣誉?这两者可能并不是同一方,甚至可能根本没有明确定义的“方”。传统的学术引用系统是否足以处理一个可能有数百或数千个“隐藏”贡献者的场景?仅仅引用 AI 模型本身是否足够?论文没有给出答案,但它指出,隐藏 AI 使用的做法已经在学术界引发了类似于抄袭的强烈反应,这反过来又导致一些从工具中受益的研究者更加隐蔽地使用它们。在采访和博客中,陶哲轩反复强调一个观点:AI 的能力不是一个单一的量。同一个任务,根据你给它多少资源、多少辅助、如何报告结果,AI 的表现可以相差几个数量级。用他在 Mastodon 上的帖子来说,这就像评估一个人类学生的能力。是让他在考场上闭卷作答四小时,还是让他和导师、同学讨论几天再提交论文?两种场景测试的是完全不同的东西。这篇论文或许不会改变任何正在进行中的 AI 开发路线图,但它代表了一种声音:来自一个在 AI 应用于数学方面走在最前沿的实践者,却也愿意停下来问一些不那么容易回答的问题。在结尾,陶哲轩和 Tanya 在脚注中写道:“一个著名的 Tumblr 思想实验得出结论,一块香草精含量达到 44% 的蛋糕是无法食用的。”尽管我们总是幻想着它更多一点更美味。这就好像目前的 AI 使用,适量添加可以增强和丰富作品,但如果 AI 内容成为核心组成部分,将不会产生理想、有效或有价值的结果。当前 AI 的使用量或许大概还远没到 44%,但在某些领域,例如学生作业、低质量论文、社交媒体内容……这个比例正在快速攀升。因此,论文的立场是,精灵已经出了瓶子,试图把它塞回去既不现实也可能弊大于利;现在的问题是如何与它共处,同时确保人类的需求、人类的创造力、人类的理解始终处于等式的核心。参考链接:1.https://terrytao.wordpress.com/2026/03/29/mathematical-methods-and-human-thought-in-the-age-of-ai/ 2.https://arxiv.org/abs/2603.26524运营/排版:何晨龙

来源:DeepTech深科技发布时间:2026-03-31
共74条记录
  • 1
  • 2
  • 3
  • 4
  • 7

产业专题

产业大脑平台

产业经济-监测、分析、

研判、预警

数智招商平台

找方向、找目标、管过程

产业数据库

产业链 200+

产业环节 10000+

产业数据 100亿+

企业数据库

工商 司法 专利

信用 风险 产品

招投标 投融资

报告撰写AI智能体

分钟级生成各类型报告

Baidu
map