生成式人工智能让我们更接近投资专业知识的自动化
ChatGPT 和 Google Gemini 等大型语言模型 (LLM) 擅长在大型数据集上进行训练,以生成对提示的有用响应。乔治梅森大学唐纳德·G·科斯特洛商学院会计学助理教授曹毅和科斯特洛会计学副教授兼领域主席陈龙正在积极探索个人投资者如何利用 LLM 从令人眼花缭乱的公司可用数据中获取市场洞察。他们的新工作论文发表在SSRN 电子期刊上,与佛罗里达大学的 Jennifer Wu Tucker 和马萨诸塞大学波士顿分校的 Chi Wan 合作撰写,研究了人工智能识别“同行公司”或行业产品市场竞争对手的能力。
曹先生通过将这一过程与房地产市场联系起来,解释了选择同类公司的重要性。“资本市场与房地产市场类似,因为一家公司的价值部分取决于其同类公司的价值。在房地产市场中,我们根据附近类似房产的价值或所谓的‘可比公司’来定价房屋。在我们的论文中,我们旨在利用 LLM 的力量来识别可比公司,以评估公司的价值。”
这项任务既困难又必不可少。收集、汇总和管理数据以选择同行需要花费大量时间、技能和精力。然而,研究人员认为,LLM 可以为个人投资者完成大量繁重的数据汇总和分析工作,并生成一份与人类专家确定的同行名单相当的有效性名单。
曹说:“它的优势在于能够利用所有潜在的信息,因此它的表现至少与其他传统方法一样好,可以帮助我们投资者和研究人员。”
在这项研究中,陈和曹选择了谷歌的 Bard(现称为“Gemini”)作为他们的法学硕士项目,因为“Bard 更有能力利用其预训练数据,可以说比 ChatGPT 的数据更大,并且具有更多参数,”曹说。
在对“产品市场竞争”进行定义并形成对巴德的提示后,研究人员指示巴德将其知识库限制在 1981 年至 2023 年期间的特定年份,以避免“前瞻偏差”,即未来的信息扰乱结果。
他们将焦点公司限制为大型上市公司,因为小型或私营公司的数据较少。总而言之,数据集包含超过 300,000 个焦点公司年。
平均而言,法学硕士可以为一家焦点公司生成大约七家同行公司,这个数字与美国证券交易委员会关于公司应如何披露其部门的建议相似。
研究人员随后将法学硕士的表现与三位人类专家为 40 家领先的计算机软件公司生成的列表进行了比较。平均重叠率略高于 40%,高于预期。
他们还将人工智能识别的同行名单与两种识别同行的替代系统进行了比较:联邦政府的标准行业分类 (SIC) 代码和基于文本的网络行业分类 (TNIC),后者根据 10-K 文件中的语言相似性对公司进行比较。LLM 的产出与 TNIC 的产出有显著重叠。此外,LLM 识别的同行通常比 SIC 和 TNIC 识别的同行更合适,因为他们的月度股票回报率更接近焦点公司。
但在为样本中的中型企业识别同行方面,TNIC 的表现优于 LLM,这表明 LLM 并非普遍具有优势的明确案例。
曹指出:“我们需要明白,法学硕士实际上是一种非常强大的新工具,其效率、以低成本处理大量信息的能力以及对公众的可访问性都是无与伦比的。”
陈补充道:“这对个人投资者尤其有利,因为我们谈论的所有成本问题对他们来说都特别重要。”
关于法学硕士的未来,陈表示:“使用生成式人工智能总是有成本和收益的。目前还不确定当前的系统是否会很快过时。”当被问及美国证券交易委员会为投资者采用人工智能工具时,陈强调,用户需要了解使用人工智能的利弊,以便做出明智的判断,“因为人工智能不能对其提供的信息或使用方式负责。”
陈总结道:“我们需要接受这项新技术,但我们必须认识到它还不够完美。改进这项技术的竞争非常激烈。我们的发现可能仅仅代表了这项技术有效性的下限。”
更多信息: Yi Cao 等人,生成式人工智能能否协助投资者?对机器生成的同类公司的评估,SSRN 电子期刊(2024)。DOI :10.2139/ssrn.4761624
页:
[1]