一、什么样的数据是好数据?
1、准确性
这是最根本的一条原则。这个准确有二个层面的意思,一个是数据指标在技术实现过程中,是准确的,不会出现代码逻辑写错,源数据取错。二个统计源数据的源头的数据是对的,如果统计数据指标的基础数据都是错了,那就更666了。一个公司数据收集与记录的准确、完整也一定是一个持续迭代的工程,当然这属于哪一个话题,有空再论。
2、有效性
数据指标的能真实反映要能衡量相对的业务场景商业目标,例如:要针对衡量一个网站流量质量设计一个指标,使用UV来衡量是错误的。使用跳出率来衡量,有一定的有效性,但还是不够有效;使用转化率也许才是比较合适的(不同公司所要追求的商业目标不一样,所以设计的数据指标是不一样的),用最近期望用户完成的商业动作访问数/进来的访客数。
3、周期性
数据指标需要定期去复盘。像KPI的指标定义,例如:销售额可能根据当前商业的目标不同,计算口径可能会发生很大的变化。同时,对各个数据指标也要定期进行复盘,是否还可以继续衡量,数据指标还是否有意义。随时KPI指标的变化,往往很多指标的口径也要变更,数据开发最怕就是这个,口径变换要重刷历史。
4、可实现性
在实际企业中,可能受限数据的完整性因素,很多指标没有办法计算得到。例如:公司的市场占有率往往是很难统计,因为整个市场份额这个数据很难获取。电商中每个订单的成本的计算也很难,广告费用、仓储、人员工资、仓储、物流配送等。所以在数据指标的可实现性上往往需要先实现简单的,再根据数据应用深入,数据团队技术强大不断再完善复杂的指标。
二、什么样的数据叫异步数据?
请求端不会因为数据响应而阻塞流程,例如前端ajax请求,mq消息
三、什么样的点云数据是处理好的数据?
处理好的点云数据应该具备以下特点:
1. 无噪声:点云数据应该经过一定的滤波和去噪处理,避免因传感器测量误差而产生的噪声。
2. 统一的坐标系:点云数据应该统一在同一坐标系下,便于后续的处理和分析。
3. 完整性:点云数据应该是完整的,不应该存在缺失或不规则的形状。
4. 标准化:点云数据应该遵循标准格式,如PLY、OBJ或等等,方便在不同软件平台之间进行交互和共享。
5. 包含有用信息:点云数据应该包含有对应目标的有用信息,如RGB颜色、法向量、曲率等数据,方便后续的3D重建、分类和识别等处理。
四、什么是图数据库大图数据原生数据库?
`图数据库(Graph database)`` 并非指存储图片的数据库,而是以图这种数据结构存储和查询数据。
图形数据库是一种在线数据库管理系统,具有处理图形数据模型的创建,读取,更新和删除(CRUD)操作。
与其他数据库不同, 关系在图数据库中占首要地位。这意味着应用程序不必使用外键或带外处理(如MapReduce)来推断数据连接。
与关系数据库或其他NoSQL数据库相比,图数据库的数据模型也更加简单,更具表现力。
图形数据库是为与事务(OLTP)系统一起使用而构建的,并且在设计时考虑了事务完整性和操作可用性。
五、大数据决策的数据是?
决策的数据是精准的科学数据,大数据是科学决策的重要工具,是高精度对未来进行预测的手段,数据是记录人类行为的工具。靠大数据技术对未来做一个预测和参考是人类发展的成果。但是,人类的沟通和交流不该因为大数据技术而遭弃,而过于依赖大数据的预测和推理,放弃人际沟通过程,必然产生人际沟通的弱化,进而影响到人的自由意志。
六、10086大数据是什么数据?
10086大数据也就是“移动大数据”,是依附于“中国移动”海量的用户群体的大数据,包含中国移动的用户上网行为数据,用户的通话行为数据,用户的通信行为数据,用户的基本特征分析,用户的消费行为分析,用户的地理位置,终端信息,兴趣偏好,生活行为轨迹等数据的存储与分析。
“移动大数据”不光可以实时精准数据抓取,还可以建立完整的用户画像,为精准的用户数据贴上行业标签。比如实时抓取的精准数据还筛选如:地域地区,性别,年龄段,终端信息,网站访问次数,400/固话通话时长等维度。如用户近期经常访问装修相关的网站进行访问浏览,或者使用下载装修相关的app,拨打和接听装修的相关400/固话进行咨询,就会被贴上装修行业精准标签,其他行业以此类推。
七、小非农数据和大非农数据的区别?
大非农和小非农是两种不同的数据来源,对于投资者而言,它们的区别如下:
1. 数据来源不同:大非农(Big Data)是由非营利组织美国劳工部(U.S. Department of Labor)发布的就业数据,而小非农(Little Data)则是由美国劳工部和数据公司(Data Company)合作发布的小型就业市场报告。
2. 数据范围不同:大非农的数据范围更广,涵盖了美国整个就业市场,而小非农的数据范围更小,只涵盖美国就业市场中的一部分,例如在某些行业特定的就业市场数据等。
3. 时间不同:大非农是每周六发布,发布时间固定在美国时间下午5点,而小非农则固定在每周三发布,发布时间可能略有不同。
4. 对投资者的意义不同:大非农和小非农在数据公布后对投资者的意义不同。对于投资者而言,大非农是一个重要指标,可以帮助他们评估美国就业市场的健康状况和整体经济的表现。而小非农则通常被视为一个指标,可以帮助投资者了解特定领域的就业市场数据,例如某个特定行业或领域的就业数据等。
因此,大非农和小非农在数据类型、数据来源、数据范围和时间等方面都存在不同,对投资者而言,需要根据数据公布情况,结合自己的投资需求和风险偏好,做出不同的投资决策。
八、数据湖是拉数据还是推数据?
数据湖可以同时拉取和推送数据。拉取数据是指将各种来源的数据存储在数据湖中,包括结构化数据、半结构化数据和非结构化数据,以供后续分析和利用。而推送数据是指将数据信息推送至数据湖,例如实时数据流或数据更新。因此,数据湖不仅可以通过拉取数据实现数据存储和管理,还可以接收实时或定期推送的数据,使得数据湖成为一个灵活且全面的数据存储和管理平台,满足各种数据需求。
九、哪些是定性数据?(哪种类型的数据是定量数据?)?
统计学上的定性数据(Qualitative Data)包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性。
十、大数据的数据可视化是什么样的?
1 大数据的数据可视化通常是非常丰富和多样化的,可以用各种图表和图形来呈现复杂的数据关系和趋势。2 由于大数据集合的复杂性,常常需要通过数据可视化的方式将海量的数据进行汇总和概括,因此需要使用多种不同的工具和技术。3 例如,热力图、地图、饼图、散点图、折线图、柱状图等等都可以用来呈现数据的不同方面和特征,而且还可以进行交互式的操作,使用户更加深入地探究数据集合。