尊龙凯时人生就是搏·(中国大陆)入口ღ★,尊龙人生就是博官网登录尊龙人生就是博ღ★,Z6尊龙凯时ღ★,尊龙凯时 - 人生就是搏!ღ★,尊龙凯时人生就是博官网登录ღ★!尊龙凯时·「中国」官方网站尊龙凯时登录首页ღ★。中国深度求索(DeepSeek)公司表示ღ★,DeepSeek R1模型已完成小版本升级ღ★,令大模型的思维深度与推理能力显著提升ღ★。
与此同时ღ★,美国Anthropic公司推出“克劳德4”系列两款新模型ღ★,为业界提供更高标准的编程ღ★、推理和智能体应用ღ★。
面对大模型在推理能力ღ★、思维深度方面的较量日益“白热化”ღ★,国内量化私募基金也加入“角逐”ღ★,在AI大模型底层技术研发方面也取得突破ღ★。
国内量化私募基金念空科技与上海交通大学计算机学院开展合作ღ★,提出一种全新的大模型训练框架(SASR)ღ★,并发表论文投向全球顶级人工智能会议期刊NIPSღ★。
念空科技创始人王啸在6月3日接受本报记者专访时表示d88尊龙ღ★,这项全新的大模型训练框架(SASR)ღ★,在GSM8K任务中ღ★,在仅使用1.5B模型的情况下ღ★,准确率就超过了80%ღ★,接近GPT-4o的表现ღ★;而在KK逻辑推理任务中ღ★,其准确率比GPT-4o还高出约9个百分点ღ★。SASR让通用大模型变得更“聪明”ღ★。
他告诉记者ღ★,当前大模型技术的训练框架ღ★,主要围绕监督微调(SFT)和强化学习(RL)ღ★,所谓监督微调(SFT)就是不断给大模型输入资料和案例进行监督训练ღ★,相当于“刷题”ღ★; 强化学习(RL)则侧重强化大模型的逻辑推理能力ღ★,让大模型更准确理解用户需求ღ★,“生成”用户所需的答案ღ★。但是ღ★,如何进一步优化大模型的刷题效果与逻辑推理能力的比重ღ★,正成为大模型能否更加“聪明”的一大挑战ღ★。
“我们期待这个全新的大模型训练框架ღ★,能够解决这项挑战ღ★,让大模型在不增加数据量的情况下ღ★,通过优化SFT和RL的关系ღ★,也能达到预期的聪明效果ღ★。”王啸向记者指出ღ★。
他向记者透露ღ★,念空科技已将这项训练框架应用在量化投资策略研发领域ღ★,并发现相比以往的AI应用ღ★,它带来两大新变化ღ★,一是基于这项新训练框架的大模型在市场预测准确性方面已达到传统量化投资模型的约80%ღ★,随着新训练框架下的大模型日益“聪明”ღ★,其预测准确性有望超过传统量化投资模型ღ★;二是新训练框架下的大模型与传统量化投资模型的相关性低于50%ღ★,这意味着两者有较高带来1+1大于2的效果ღ★,提升整个量化投资策略的成效我把数学课代表捅哭了ღ★。
多位量化私募业内人士向记者透露ღ★,随着AI大模型迭代升级ღ★,如今量化私募基金对AI大模型底层技术的研发布局ღ★,日益侧重算法优化我把数学课代表捅哭了ღ★。在这个过程ღ★,产学研的结合将是他们在大模型底层技术研发方面取得突破的“捷径”ღ★。毕竟ღ★,大学研究机构具有先进的大模型算法优化理论基础与科研能力ღ★,但缺乏更多的算力支持与工程能力ღ★,而这些短板恰恰是量化私募基金的“强项”ღ★,两者可以形成“互补”ღ★,助力国内大模型变得更“聪明”ღ★,在全球AI发展格局拥有更大的话语权ღ★。
在业内人士看来ღ★,量化私募基金要“再造”一个Deepseekღ★,难度相当高ღ★。具体而言ღ★,一是通用大模型的研发需要大量资金ღ★、算力ღ★、数据训练ღ★、算法研究的投入ღ★,未必是每家量化私募基金都能负担得起ღ★,二是随着通用大模型市场格局初步清晰ღ★,新生的通用大模型“脱颖而出”正面临更多挑战ღ★。因此ღ★,越来越多量化私募基金将目光瞄准通用大模型的算法优化ღ★,助力国内通用大模型变得“聪明”ღ★,令后者各项性能“赶超”海外知名的通用大模型ღ★。
王啸向记者透露ღ★,近年ღ★,通用大模型的算法优化ღ★,正成为提升大模型整体能力的重要突破口ღ★。2023年ChatGPT的面世ღ★,主要基于庞大数据的预训练与监督微调(SFT)ღ★,年初Deepseek的强势崛起ღ★,则让市场意识到强化学习(RL)对提升大模型逻辑推理能力显得至关重要ღ★。如今ღ★,越来越多AI公司对通用大模型的训练方式升级与算法优化ღ★,都采取SFT+RL模式ღ★,比如Deepseek的论文介绍其训练过程分成SFT-RL-SFT-RL四个过程ღ★。
“问题是固化的SFT+RL训练模式未必能让大模型聪明度快速提升ღ★。”他告诉记者d88尊龙d88尊龙ღ★。若大模型的训练模式过度侧重SFTd88尊龙ღ★,其结果是大模型刷了很多题ღ★,但缺乏思考与总结ღ★,聪明度提升存在天花板ღ★;反之过度侧重RLღ★,其结果是大模型尽管擅于思考总结ღ★,但缺乏大量刷题所积累的基础知识d88尊龙ღ★,令幻觉问题难以明显缓解ღ★。”他告诉记者ღ★。因此现有的通用大模型所构建的监督微调(SFT)与强化学习(RL)训练框架我把数学课代表捅哭了ღ★,面临数据精准拟合与高质量思维链(CoT)的高度依赖ღ★、以及训练不稳定等方面的限制ღ★。为了解决这些影响大模型“聪明度”的掣肘ღ★,念空科技与交通大学计算机学院合作提出了一个新框架ღ★,即一个自适应的混合训练框架ღ★,在算法优化过程能动态平衡SFT与RLღ★。比如新训练框架在使用SFT时ღ★,在预热阶段建立基本推理能力ღ★;在后续训练阶段又能自主切换SFT与GRPO算法混合训练ღ★,通过梯度范数调整训练概率ღ★,确保训练方案之间的平滑过渡ღ★,在探索不同路径同时保持大模型的良好逻辑推理能力ღ★。
通俗而言ღ★,在这个全新的训练框架下ღ★,大模型会自主设定一个动态的评估体系ღ★,根据数据训练环节的监督微调(SFTღ★,刷题)效果ღ★,自主决定下一步是继续“刷题”ღ★,还是切换成思考总结(强化学习ღ★,RL)从而通过动态调整监督微调(SFT)与强化学习(RL)的步骤与切换节奏ღ★,达到更好的训练效果ღ★,让大模型自己变得更“聪明”ღ★。
今年ღ★,王啸创立上海全频思维人工智能科技有限公司AllMindღ★,主营业务是专注研究通用大语言模型(LLM)的相关底层算法和工程技术ღ★。AllMind的一项重要工作d88尊龙ღ★,是与交通大学计算机学院合作ღ★,创建这项全新的通用大模型训练框架ღ★。
王啸坦言ღ★,在创建这项大模型全新训练框架过程ღ★,他们也走了一些弯路ღ★,包括技术路线的调整与研究方向的优化ღ★。最终ღ★,双方在不懈努力下ღ★,设计了一种step by step的训练方法ღ★,在下一个step训练前ღ★,通用大模型可以根据所设计的自适应算法ღ★,决定下一个step使用SFT还是RLღ★,从而达到更好的训练效果ღ★。目前我把数学课代表捅哭了ღ★,通过在GSM8K我把数学课代表捅哭了ღ★、MATH和KK三个公开数据集的实验表明ღ★,这项新训练框架的性能优于单独SFTღ★、单独RLღ★、以及简单混合的SFT+RL训练方法ღ★。
在业内人士看来ღ★,训练框架创新与算法优化ღ★,正成为通用大模型比拼综合性能的重要突破口ღ★。如今ღ★,越来越多“聪明度更高”的通用大模型正呈现一个新特征ღ★,即他们的参数量未必很高ღ★,但综合能力不亚于同行ღ★。这背后ღ★,是训练框架创新与算法优化ღ★,令通用大模型在同等数据ღ★、算力的情况下具有更出色的训练效果ღ★。
“当前能在算法优化与训练框架创新方面取得突破的量化私募基金并不多ღ★,原因是这需要产学研的融合发展ღ★,一方面需要高校研究机构提供理论基础与科研能力ღ★,另一方面需要量化私募基金充分应用自身的AI应用经验与工程能力ღ★,以及提供足够的算力支持我把数学课代表捅哭了ღ★,两者缺一不可ღ★。”一位量化私募基金人士向记者直言ღ★。
“AllMind将着眼于通用大模型的基础学术研究与应用ღ★,不以盈利为目的ღ★。我们将推动这项训练框架持续迭代ღ★,进一步提升通用大模型的逻辑推理能力与减少幻觉问题ღ★,让大模型变得更聪明同时ღ★,为国内大模型在全球AI格局赢得更大的话语权ღ★。”他指出ღ★。
记者多方了解到ღ★,训练框架创新与算法优化能否令通用大模型变得“更聪明”ღ★,并不是实验室“说了算”ღ★,还需“实践出真知”ღ★。
王啸对此向记者表示ღ★,所有垂直领域的大模型训练核心框架是趋同的ღ★,都需要高质量的Prompt与CoT数据ღ★,在先做监督微调(SFT)的基础上ღ★,让大模型获得某个垂直领域的基本认知后ღ★,再进行强化学习(RL)ღ★,进而找到一个正确且高效的数据训练模式ღ★,让大模型变得越来越“聪明”ღ★,能自动生成这个垂直领域的各种准确“答案”ღ★。因此ღ★,AllMind的发展步骤ღ★,是强化通用大模型训练算法优化与工程技术研究ღ★,以及高质量CoT数据生产方向的学术探索ღ★,增强通用大模型在金融场景的垂直应用ღ★,若这项工作取得良好成效ღ★,就有底气将这套全新的训练核心框架与训练模式输出给新材料ღ★、医药研发等垂直领域ღ★,让更多垂直领域的大模型都变得“更聪明”ღ★。
他透露ღ★,念空科技正通过新训练框架下的大模型ღ★,研发新的量化投资预测模型ღ★。具体而言ღ★,传统的量化私募基金使用AI技术所搭建的量化投资模型ღ★,主要是针对以往股市交易数据等因素进行拟合与归纳总结ღ★,从而预测未来并寻找投资获利机会ღ★。比如一种传统的AI量化投资模型会将过去数年的股市基础数据与一些特征ღ★,通过机器学习与深度学习算法进行训练ღ★,让模型对过去数年的股市波动规律进行总结归纳ღ★,从而预测未来并挖掘相应的投资获利机会ღ★,这本质是基于统计驱动的量化投资模型ღ★,如今ღ★,他们正通过新训练框架下的AI大模型进行预测d88尊龙ღ★,找到一种通过逻辑驱动的ღ★、全新的量化投资模型构建思路ღ★。
“目前ღ★,基于这项全新训练框架的大模型在市场预测准确性方面达到传统量化投资模型的约80%ღ★,而且其与传统量化投资模型的相关性低于50%ღ★,有望带来1+1大于2的效果ღ★,可以给现有传统的量化投资模型提升投资准确性带来有益的补充ღ★。”他告诉记者ღ★。这令他开始相信这项全新训练框架有望令大模型在其他垂直领域应用方面同样能取得一系列成绩ღ★。
记者多方了解到ღ★,历经训练框架创新与算法优化的大模型能否在其他垂直领域同样“变得聪明”ღ★,面临的变数相当多ღ★。比如在数据量极其庞大与复杂的互联网行业ღ★,大模型需要连接尽可能多的GPU与服务器进行高效的大规模数据训练ღ★,因此算法与工程能力的挑战或远远超过金融领域ღ★。
多位量化私募业内人士指出ღ★,这正成为不少量化私募基金探索大模型算法优化方面的新方向ღ★。为此他们也在与高校科研机构合作ღ★,将理论基础与自身在大模型的算法与工程技术运用经验进行结合d88尊龙ღ★,找到更优的算法与训练框架ღ★。
王啸告诉记者ღ★,金融大模型的难点ღ★,在于如何在过拟合与欠拟合之间找到最理想的平衡点ღ★。短期内ღ★,AllMind正着手解决这项挑战ღ★。长期而言ღ★,念空科技希望能赋能大模型在更多垂直领域都变得更加聪明ღ★,推动中国大模型行业发展ღ★,增强中国大模型在未来全球AI格局的竞争力ღ★。
尊龙凯时人生就是搏 | 尊龙凯时人生就是搏 | 尊龙凯时人生就是搏 | 尊龙凯时人生就是搏 | 尊龙凯时人生就是搏 | 尊龙凯时人生就是搏 | 网站地图 | 网站地图_m |
Copyright © 广州尊龙凯时人生就是搏企业集团股份有限公司
粤ICP备15022219号
粤公网安备 44010602011620号
尊龙凯时人生就是搏·(中国区)官方网站|
http://www.zhongzehr.com