最新研究显示,多个 AI 模型已能在几分钟内通过享有盛誉的 CFA 三级考试,而人类通常需要数年时间和约 1000 小时学习才能完成。
纽约大学斯特恩商学院和 AI 财富管理平台 GoodFin 的研究人员测试了 23 个大型语言模型,发现包括 o4-mini、Gemini 2.5 Pro 和 Claude Opus 在内的前沿推理模型能够成功通过 CFA 三级模拟考试。
这些模型采用 " 思维链提示 " 技术,有效应对了此前令 AI 头疼的论文题型。GoodFin 创始人兼首席执行官 Anna Joo Fee 表示:
我认为这项技术绝对有未来改变整个行业的可能。
AI 模型全面突破 CFA 三级考试壁垒
两年前的研究曾发现,AI 模型能够通过 CFA 一级和二级考试,但在三级考试的论述题环节遭遇重大障碍。
最新研究证实,AI 技术的快速发展已经克服了这一关键瓶颈。
研究团队对 23 个大型语言模型进行了全面测试,特别关注 AI 模型是否具备 " 专业金融决策所需的专业化、高风险分析推理能力 ",以此评估其在 CFA 三级模拟考试中处理选择题和论文题的能力。
研究结果表明,在处理复杂金融问题时,推理模型的表现显著优于传统的非推理模型。特别是采用 " 思维链提示 " 技术的前沿推理模型成功通过了相关考试测试。
其中 Gemini 2.5 Pro 在论述题评分中获得 3.44 分的最高成绩,同时在综合表现(选择题和论述题)中以 2.1 分位居榜首。
值得注意的是,国产的 KIMI K2 模型在多选题中表现最佳,正确率高达 78.3%,超过谷歌的 Gemini 2.5 Pro 和 GPT-5。
研究采用了零样本、自我一致性和自我发现三种提示策略,其中自我一致性策略取得 73.4% 的最佳表现评分。
在成本效益分析中,Llama 3.1 8B Instant 获得 5468 的最佳成本效率评分,而 Palmyra Fin 以 0.3 秒的平均响应时间成为速度最快的模型。
尽管 AI 在标准化考试中表现出色,但业内专家认为完全替代人类金融专业人士仍存在局限。Fee 强调:
诸如情境理解和意图判断等方面,机器目前还难以准确评估。这正是人类的优势所在,能够理解客户的肢体语言和各种暗示。
登录后才可以发布评论哦
打开小程序可以发布评论哦