讲解员:大数据

大数据是一个术语,用来描述通过有意义的方式进行分析和可视化,可以提供深刻的结论的大型和复杂的数据集。传统数据库工具不具备管理大量非结构化数据的能力。

大数据通常被定义为一组数据集的集合,这些数据集非常庞大和复杂,以至于使用现有数据库管理工具或传统数据处理应用程序难以处理。关系数据库管理系统和桌面统计和可视化包通常在处理大数据方面存在困难。相反,这项工作需要在数十台、数百台甚至数千台服务器上运行“大规模并行”软件。大数据必须通过先进的分析工具和算法来处理,以揭示有意义的信息。

在过去的五年里,新的互联网和生物识别技术出现了,它们能够将来自不同信息源的数据筒仓组合到一个统一的位置,在那里数据可以被分析。

大数据通常包括的数据集的大小超出了常用软件工具在可容忍的时间内捕获、管理、处理数据的能力。大数据的“大小”范围从几十tb到许多pb。大数据通常被描述为一组技术和技术,这些技术和技术需要新的形式的集成,以从多样化、复杂和大规模的大型数据集中发现巨大的隐藏价值。

大数据涉及的流程包括:分析、捕获、数据管理、搜索、共享、存储、传输、可视化和信息隐私。这个术语通常只是指使用预测分析或其他某些高级方法从数据中提取价值,很少用于特定规模的数据集。大数据的准确性可能会导致更自信的决策。对企业和政府来说,更好的决策意味着更高的运营效率、成本降低和风险降低。

数据集的规模越来越大,因为越来越多的信息传感移动和遥感设备、软件日志、照相机、麦克风、射频识别(RFID)阅读器、无线传感器网络、生物识别设备和数据库正在收集这些数据集。自上世纪80年代以来,全球科技人均存储信息的能力大约每40个月就翻一番。大企业面临的挑战是决定由谁来运营贯穿整个组织的大数据项目。

对数据集的分析可以发现新的相关性,允许用户发现业务趋势、预防疾病、打击犯罪和恐怖主义,以及其他数据密集型应用程序。科学家、企业高管、媒体、广告商和政府经常在互联网搜索、金融、商业信息学、国家安全和治安等领域遇到大数据集的困难。科学家在研究气象学、基因组学、连接组学、复杂物理模拟以及生物和环境研究时遇到技术限制。

大数据系统旨在让这些参与者更容易地找到关联,以帮助他们解决问题。大数据通常以体积、多样性、速度、可变性、准确性和复杂性来衡量。大数据系统通常在高级数据中心使用基于云的服务器,而不是集中的大型机处理器。

文章主题

||

最新的生物识别乐动体育西班牙人技术新闻

评论

对“大数据”的3个回复

留下一个回复

这个网站使用Akismet来减少垃圾邮件。了解评论数据是如何处理的

本周阅读最多

公司的特色

乐动体育sport

乐动体育西班牙人生物识别技术白皮书

乐动体育西班牙人生物识别事件

解释生物识别技术乐动体育西班牙人

Baidu