我们如何构建内部数据分析代理

Qubot是我们的内部Copilot支持的分析代理,允许任何GitHub员工以通俗易懂的语言询问有关我们数据的问题。以下是我们在构建过程中学到的知识。我们如何构建内部数据分析代理的文章首先出现在GitHub博客上。

作为软件工程的员工经理, Matteo Vasirani负责GitHub的产品分析和数据科学。大型数据和分析组织通常难以真正自助访问数据和洞察。几十年来,这个行业一直试图解决这个问题,但都没有成功,但现在人工智能为我们提供了一种可靠的方法。

在GitHub规模上,为数十个产品团队提供专门的分析支持具有挑战性,因此许多团队只能自己解决这个问题。

虽然产品和工程团队可以使用许多有价值的产品遥测来做出决策,但如果没有数据分析师的支持,确定哪个数据模型,哪个颗粒,哪个过滤器,然后编写查询并验证结果一直很困难。进入Qubot,这是我们的内部GitHub Copilot支持的分析代理。

Qubot允许任何Hubber (我们称之为GitHub员工)以简单的语言询问有关GitHub数据仓库中任何数据模型的问题,并在几秒钟内得到答案。Qubot不是报告工具或仪表板替代品。

相反,它适用于探索性问题,例如“哪一组用户对此功能的留存率最高?”或“上周哪些产品对提升此指标的贡献最大?” “Qubot的维护成本为零,并帮助团队快速提升他们可能不熟悉的数据集。在这篇博客文章中,我们将介绍我们如何构建Qubot,它是如何变化的,以及我们学到了什么。