“这并不是说这些技术会给你带来绝对的垃圾。美国加州大学圣克鲁斯分校巴斯金工程学院的计算机科学与工程副教授塞什·塞沙德里说:“他们可能有一些信息,但没有很多人相信的那么多。
塞沙德里是3月2日发表的关于新发现的论文的第一作者国家科学院学报。这项研究评估了被称为“低维嵌入”的技术,这些技术通常被用作机器学习模特。这是一个活跃的研究领域嵌入快速发展的方法。但是塞斯哈德里和他的合著者说所有这些方法都有相同的缺点。
为了解释这一点,Seshadhri举了一个社交网络的例子,这是一种常见的复杂网络。许多公司将机器学习应用于社交网络数据,以生成关于人们行为的预测、对用户的推荐等等。嵌入技术本质上是将一个人在社交网络中的位置转换成几何空间中一个点的一组坐标,从而为每个人生成一个数字列表,并插入到一个算法中。
“这很重要,因为一些抽象的东西,比如一个人在社交网络中的位置,可以被转换成一个具体的数字列表。另一个重要的事情是,你想把它转换成一个低维空间,这样代表每个人的数字列表就相对较小了,”塞沙德里解释道。
一旦转换完成,系统就会忽略实际的社交网络,根据空间点之间的关系做出预测。例如,如果你周围的很多人都在购买某个特定的产品,系统可能会预测你可能会购买相同的产品。
塞沙德里和他的合著者从数学上证明了复杂网络在嵌入过程中丢失。他们还通过在不同种类的复杂网络上测试各种嵌入技术,从经验上证实了这一结果。
“我们并不是说某些特定的方法会失败。我们说,任何给你一个小数字列表的嵌入方法从根本上来说都会失败,因为低维几何对于社交网络和其他复杂网络来说不够有表现力,”塞沙德里说。
现实社会网络的一个重要特征是三角形的密度,即三个人之间的联系。
“如果你有很多三角形,这意味着在社交网络的那一部分有很多社区结构,”塞沙德里说。“此外,当你观察社交网络有限的人时,这些三角形甚至更有意义。在典型的社会中网络有些人有很多关系,但大多数人没有很多关系。"
在他们对嵌入技术的分析中,研究人员观察到许多代表社区结构的社会三角形在嵌入过程中丢失了。“所有这些信息似乎都消失了,所以当你构建这些几何图形的时候,你想要找到的东西几乎就消失了,”塞沙德里说。
低维嵌入绝不是生成预测和推荐的唯一方法。它们通常只是非常大和复杂的机器学习模型的许多输入之一。
“这个模型是一个巨大的黑盒,许多报道的积极结果表明,如果你把这些低维嵌入包括在内,你的表现会上升,也许你会有轻微的提升。但如果你自己使用它,似乎你会错过很多,”塞斯哈德里说。
他还指出,新的嵌入方法主要是与其他嵌入方法进行比较。然而,其他研究人员最近的实证研究表明,不同的技术可以为以下方面提供更好的结果具体任务。
考虑到机器学习在我们社会中的影响力越来越大,Seshadhri说,调查模型背后的基本假设是否有效非常重要。
“我们让所有这些复杂的机器做着对我们的生活有重大影响的事情。我们要传达的信息是,我们需要更加谨慎地评估这些技术,”他说。“尤其是在这个机器学习变得越来越复杂的时代,了解哪些事情可以做,哪些事情不可以做非常重要。”
(转载:www.idcew.com)