下载客户端

数据中心运维时人与机器谁重要？阿里巴巴和腾讯高管展开辩论

澎湃新闻记者承天蒙

2019-06-25 20:18

来源：澎湃新闻

人工智能（AI），机器学习（ML），大数据和其他增强学习技术如何在数据中心中应用？机器和人类如何合作管理基础设施？

6月25日，DCD数据中心国际峰会上海站在上海中心大厦举行。针对上述议题的一场分论坛中，腾讯和阿里巴巴的高管分别对这一议题给出了不同的诠释。

腾讯数据中心研发总监岳上对腾讯研发的智能化管理数据中心软件平台——腾讯智维平台做出了介绍，解释了腾讯如何利用新技术管理巨大数据，并保证数据准确性。阿里基础设施一体化架构师汪刚则表示，在数据中心的运维中，AI只是手段，在梳理数据逻辑时，人起到的作用更大。

目前，腾讯智维管理了腾讯内部约80个数据中心，超过百万台服务器设备。如今，腾讯的数据中心测点数超过600万，每分钟可收集千万条现场数据、150G视频数据，从80个数据中心上送到平台上，腾讯智维就是基于这些数据进行着管理工作。

谈到具体实践时，岳上介绍，腾讯在保证数据准确性上从五个方面入手。

1.测点侧，监控MDC测点接入率；2.网络侧，通过技术手段，自动识别问题并判断根因，进而自动切换或者人工干预；3.视频侧，实时检查视频参数、视频格式和码率，发现问题及时告警；4.服务器侧，一旦服务器进风温度异常，及时告警；5.异常数值，对数值做了合理区间设定，系统算出异常值会预警开发者。

汪刚则认为，在数据中心的运维中，AI只是手段。“并不是说在一个数据中心里布点越多、数据越多就越好。在梳理数据逻辑时，人起到的作用更大。”

汪刚向参会观众介绍：“业界讲AI有时会把AI当作一个目的，但它只是一个手段，更重要的是数据。在使用机器学习和AI等技术之前，首先要明确数据是为了解决什么问题，数据来源是否准确。”

汪刚介绍，在采集数据之后，怎么把数据逻辑梳理清楚非常重要。数据中心运维过程中会出现假报警的情况，这种情况数据可能本身是准确的，但对场景的解释是有错误的。通过逻辑把报假警的情况输送到机器学习之前提前剔除，机器学习的效率会提高很多。

汪刚总结道：“所以并不是说在一个数据中心里布点越多、数据越多就越好，把逻辑梳理清楚，明白在什么关键的地方布什么点，传感器得到的数据才是对你来说最好的，这里面比起机器学习，人起到的作用更大。”

责任编辑：王杰

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

澎湃矩阵

新闻报料

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈