加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

作为数据产品经理,你需要知道这些技术知识

发布时间:2019-11-30 01:21:44 所属栏目:云计算 来源:顽皮木偶
导读:副标题#e# 在数据分析领域下,总会被提及诸如SQL、Hive,甚至Hardoop、Druid、Spark等这些技术上的词汇。那么作为一名数据领域的产品经理,听着这些不是很常见的产品知识,又应该具备怎样的技术知识呢?本文主要从“用户行为数据“角度介绍一整套的技术架构

平常所接触到诸如Oracle、Hive、PG等,其实这些都属于关系型数据库,本质上都是建立在SQL(结构化查询语言)的基础上,所以大的特征就是结构化。这些适合大量的数据查询,统一提供增、删、改、查、排序等多种查询。

数据库类型有很多,以下仅列举常遇见的3种:

作为数据产品经理,你需要知道这些技术知识

3.3.2 非关系型数据库(NoSQL)

此类数据库的存在是出于性能、速度等方面考虑,主要是因为关系型数据库涉及数据较大、结构复杂,一些简单、体量小的存储和查询不适合在这样的数据库进行运作,所以才有这样的数据库。

上面也提到,其中redis就是这么一种,以及MongoD、Memcache。

  • 优点:这类数据库优点在于足够快、结构单一、数据集中等;
  • 缺点:结构相对没那么规范清晰、会有重复冗余;

3.3.3 数据库表

在使用SQL查询的时候,一个关键地方就是需要知道表结构。所谓的表结构就是数据表与表之间的关系,以及具体表字段的含义。所以数据库表的设计十分重要,对后续SQL查询计算、机器运行性能、任务执行等方面有很大的影响。

作为数据产品经理,你需要知道这些技术知识

(样例:usertable_01)

存在在数据库中的就是一张张这样的表,通过SQL语句查询可以快速获取所要的数据结果。所有原始数据经过解析清洗之后,就会像这样以结构化的形式进行存储,以便于管理和使用。

表设计:系统有诸多数据指标,而对于产品或运营而言,就是定义各个指标的统计逻辑和场景。那么对于技术者来说,除了输出固定的查询语句之外,还需要进行合理的表设计。

所谓的表设计,就是根据指标体系把结构化的数据分拆成多张数据表,并进行有机关联,从而提供合理的统计输出。

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读