在企业人工智能中,有两种主要类型的模型:判别式和生成式。判别式模型用于对数据进行分类或预测,而生成式模型用于创建新数据。尽管生成式 AI 近来占据新闻头条,但企业仍在追求这两种类型的 AI。
判别式 AI 对于希望更有效地运营并追求额外收入流的企业来说仍然是一项重要的举措。这些不同类型的 AI 有很多共同点,但在构建 AI 数据基础设施时必须考虑重大差异。
企业不应只构建专门用于 AI 的基础设施,而让数据分析和数据科学等工作自生自灭。构建一个完整的数据基础设施是可能的,该基础设施支持组织的所有需求——数据分析、数据科学、判别式 AI 和生成式 AI。
结论
这篇文章概述了我们在与企业合作构建 AI 数据基础设施方面的经验。它确定了核心组件、关键构建模块和不同 AI 方法的权衡。基础元素是建立在对象存储之上的现代数据湖。对象存储必须能够大规模提供性能,其中规模为数百 PB,通常为 EB。
通过遵循此适用于 AI 和 ML 的现代数据湖参考架构,我们预计用户将能够构建灵活、可扩展的数据基础设施,虽然针对 AI 和 ML,但在所有联机分析处理 (OLAP) 工作负载上都将具有同等的性能。要获得有关组件部分的具体建议,请随时通过 keith@min.io 与我联系。