原创数据隐私和数据智能可以共存吗?
时间:2019-11-04 17:42:32 热度:37.1℃ 作者:网络
引述外媒报道,随着人工智能技术的到来,大家必须改变处理客户数据的方式。代替当前的“越多越好”的数据采集方法,我们需要集中精力仅收集保持智能所需的最小数量。
在商业环境中,数据被认为是实现财务成功的最重要资源之一,这听起来可能违反直觉。但是,这是企业需要做出的改变,收集更少的数据实际上并不像听起来那么危险。
当今商业中普遍的假设是,系统访问的数据越多,它们将越智能。但是,并非总是如此。即使是这样,反过来(即更少的数据也必须等于更少的情报)反而是不正确的。
当普遍认为更多数据是竞争性业务差异化因素的假设时,实际上是激励企业寻求新的和更多的收集数据的方法,这往往会造成灾难性的影响。
每天我们都会看到有关数据泄露,泄漏和暴露的漏洞的新闻。我们了解到有关身份盗窃和金融欺诈的恐怖故事,并且目睹了由于无法保护收集的数据而遭受声誉损害,监管惩罚和消费者强烈反对的企业。
隐私只是与压倒性地寻求更多数据相关的问题之一。大规模数据采集和管理还涉及大量成本:计算成本,存储成本,运营成本等等。我们正处于大数据,人工智能和机器学习的时代,但是,如果数据量继续与系统智能相提并论,这些成本将继续飙升。
当今的企业希望绝对了解他们对客户的一切。但是,客户对他们的每一个举动都受到监视,记录,处理和分析的想法感到后退。企业收集的数据越多,客户的感受就越大,当客户数据被盗时,每个人都会迷失。除罪犯外的所有人。
但是,如果我们对收集的数据以及如何处理和分析数据更加了解,那么实际上我们不需要任何我们认为可以收集的数据。
最关键的步骤是从收集和依赖单个数据转移到处理和分析聚合数据。例如,我们可以查看IP前缀,而不是分析来自单个IP地址的数据,从而可以获取所需的所有智能。这种方法的优势在于,我们在组级别处理数据的能力越强,对个人用户的了解就越少。尽管这可能看起来很矛盾,但事实是,即使我们需要更少的数据,我们也可以得到更多相关的情报。当我们进行要素工程设计时(这是构建高级模型的关键部分),我们可以在特定时间段内基于汇总数据创建要素。例如,一种功能,用于计算从特定设备处理的总交易额,其中每笔交易额都超过了定义的阈值。使用这种方法,我们不需要精确地知道单个交易金额。
此外,通过在小组级别进行的整体分析,我们可以发现各种行为和帐户之间的模式,趋势和共性,而这些在个人级别是无法分辨的。这使我们能够收集有价值的见解的独特层,而不必深入研究个人帐户。最终结果是对单个数据的需求更少,而整体智能则更高。派生数据增加了另一层好处,即从一个数据点,我们可以确定多个附加功能,这些功能使我们能够进一步完善结果。例如,我们可以查看IP范围以区分正常和异常移动性模式,这样,我们就可以准确地确定单个用户是否正在旅行,而无需了解诸如航班和酒店详细信息之类的细节。
使用这些技术代表着重大的转变,使我们能够更好地将自己的努力与不断发展的大数据道德标准保持一致。
我们可以从汇总数据中获得的洞察力越多,对单个用户的要求就越少。使之成为可能的是无监督机器学习(UML)。
没有UML,重点将放在利用我们对个人的了解来预测个人的未来行为。我们必须一遍又一遍地逐个客户地执行此过程。这是一种非常繁重的数据方法。使用UML,我们可以在组级别审查用户,并从观察到的帐户和操作的相关性和模式中获得有价值的情报。最终,我们只需要几个关于个人的数据点即可将其与用户子组匹配;然后我们可以预测该子组的未来行为。
在预防欺诈的我方领域,主动检测对于我们使命的成功至关重要。为了确保我们的客户安全,我们必须能够检测到迅速发展的攻击,然后才能造成损害。为了实现这一目标,我们使用汇总数据并进行整体分析,以发现异常的相关性和模式,这些相关性和模式表明了欺诈和恶意的行为和帐户。我们仅使用从任何给定用户那里获取的少量数据点就可以做到这一点。我们发现,企业通常已经拥有所需的数据,而它们只是没有有效地挖掘数据。
全球监管领域的发展清楚表明,我们正在朝着提高隐私和透明度的方向发展,并且对数据收集的限制越来越严格。但这并不一定意味着我们的数据智能下降。通过整体数据分析实践,先进的AI和无监督的机器学习,我们可以在保持用户隐私的同时获得高水平的智能。
随着围绕数据采集和管理的现实变化,UML的价值正在迅速变得更加明显,特别是与有监督的机器学习相比。尽管SML在无休止的数据丰富的环境中具有一定意义(我们想知道的越多,我们向算法输入的数据就越多),但这种不受限制的数据采集速度会带来严重的问题。使用UML,我们可以更改范例,因为我们可以减少需要从个人那里获取的信息。对隐私的影响是立竿见影的。当涉及到偏差(如SML所要求的带有标记数据的引用)时,它也具有明显的优势。UML是客观的;它仅根据在非结构化数据中发现的模式执行分组。
我们已经看到银行和支付行业正在积极利用这些新功能。例如,金融服务提供商立即了解UML可以带来的价值。侵犯隐私权,提高安全性和验证措施一直与客户的摩擦加剧有关。借助UML,这些企业能够提供客户期望的出色体验,而不会增加不必要的摩擦。在当今数字经济中,金融机构必须在风险管理,客户体验和道德数据获取之间取得适当的平衡,这一点至关重要。
今天,我们站在一个新时代的门槛上,在这个时代,道德和情报不必相互排斥。