当前位置：谷粒网 > 在线学习 > 正文

常用的三种数据模型 (常用的三种数据模型)

作者：何丽欢在线学习 2023-04-24 07:19:22 阅读：24

数据分析中有哪些常见的数据模型？

在现在互联网高速发展的时代里，各大企业都纷纷往数据化运营靠近，除了数据分析师岗位以外，产品、运营或者市场等等岗位都开始对数据分析能力有所要求。

而对刚接触数据分析的朋友来说，往往都会觉得困惑，每天就是写SQL，也不知道该从哪里开始分析，分析些什么。说实在，数据分析就是为了用数据去对公司当下一些决策、行为等进行分析，预测走向并提出建设性意见。

而对小白来说，最需要做的是搞清楚数据分析的核心目标，再套用数据分析模型，根据模型中的内容，细分到不同的数据指标进行细化分析，最后得到想要的结果。下面我就分享一下最常见的几种数据分析模型，收藏收藏~

一、逻辑树分析模型

把问题的所有子问题分层，从最高层开始初步向下扩展。也就是把一个已知问题当成“树干”，思考该问题和哪些子问题有关联，将有关的问题当成“树枝”，以此类推，找到所有相关的问题形成一个“逻辑树”。

逻辑树使用方法简单，而且条理清晰，容易掌握，并且可以保证解决问题的过程足够完整，把问题细化再细化，从而详细地分析得出结论。

逻辑树分析三要素：

1、要素化：将相同问题总结归纳要素

2、框架化：把各个要素组成框架，做到不重不漏

3、关联化：框架里的每个要素保持其必要的相互关系

二、留存分析模型

留存分析是指一种分析用户参与情况、粘性的分析模型，考察初始行为的用户会有多少人会有后续行为，是一种衡量产品对用户价值高低的重要方法。通过留存分析可以判断产品保留用户的能力和对不同群体的留存是否能够带来不同效果。

留存方式：

1、N-day留存：指第几天留存，就是计算第N天后发生了回访行为的用户。

2、Unbounded留存：指几天内留存，也就是计算多少天内完成了回访的用户总数。

3、Bracket留存：指定观察期，自己划分不同观察期来计算回访用户（如：第一个观察期：第二天；第二个观察期：第三天至第五天......）

三、漏斗分析模型

漏斗分析模型是一个线性流程，从开始到结束，用户在每个环节都可能产生流失。该分析模型能够科学反映用户行为状态及起点到终点每个阶段的情况，按照漏斗从上往下层层分析，找出每个阶段可以改进优化的点。

漏斗分析的特点：

1、监控用户在每个层级的转化情况，找到最有效转化路径，找到可优化的缺点，提高用户体验

2、漏斗分析可帮助企业更细致地捕捉用户行为，提高转化的精度和效率。

3、漏斗分析可以对层级之间不同用户属性进行比较，找到各环节的转化率，再针对性地对异常环节进行调整。

四、SWOT分析模型

SWOT分析也可以叫做态势分析，S指Strengths优势，W指Weaknesses劣势、O指Opportunities机会，T指Threats威胁。

机会和威胁是公司发展过程中不断发生的事情，这里一般是指环境威胁和环境机会，其中机会是对公司行为有利、有吸引力的领域；威胁是一种不利的发展趋势而带来的挑战，需要及时采取战略行为，否则会导致公司在同领域的地位下降。

优势和劣势是指将公司与竞争者从产品的新颖程度、销售渠道通畅与否、制作工艺是否复杂或者价格有无竞争力等方面进行详细对比。

SWOT的分析步骤：

1、确认企业当前发展战略

2、确认企业外部环境变化

3、根据企业内部情况，确认企业的优劣

4、以通用矩阵或其他方式评价

五、5W2H分析模型

5W2H简单来说，就是why为什么，what什么事、who谁、when什么时候、where什么地方、how怎么做、how much多少，这个分析方法提供了一种全面的分析角度剖析，帮助快速界定问题。

举个例子：用户买了个产品

Why：他为什么买？

What：买了什么产品？有什么用？

Who：用户是哪一类群体？学生？白领？

When：什么时候会买？

Where：在哪里买的？线下还是线上?

How：怎么买的?

How much：买这个产品花了多少钱？

六、用户分群模型

用户分群模型是根据用户的行为特征、爱好等属性，把具备共同属性的用户划分成一个整体。当产品投放推广一段时间后，企业获得一定量的用户，就需要对用户进行分群，可以帮助企业了解用户，根据用户的不同特点制定针对性的优化方案。

用户分群又分为：

普通用户分群：分析用户属性和行为特征

预测用户分群：通过机器学习算法预测时间概率

以上是数据分析比较常见的几种分析模型，对于新手来说，可以好好了解学习一下，根据工作中的实际问题具体分析，但是也不能一味的套用模型，面对不同情况需要进行不同的改进哦！

数据仓库的数据模型是什么？

数据仓库接典型的两种数据仓库建模的理论是维度建模和基于主题域的实体关系建模，这两种方式分别以Kimball和Immon两位大师为代表。维度建模以数据分析需求为驱动，倡导总线架构：一致的事实和一致的维度，这种数据模型易于用户理解和数据分析操作。基于主题域的实体关系建模以源系统数据为驱动，整合企业的所有数据，站在企业级的高度对数据进行抽象，整合，采用3NF的实体关系理论建模，这种数据建模方式以更为抽象的方式尝试建立一个相对稳定的数据模型，并能描述企业级的数据关系。在工业界往往把两种方式结合起来运用数据仓库的不同数据层次结构中。

我们上周主要是针对采用基于主题域的实体关系建模中数据整合的方式进行较为深入的讨论，讨论了以下三种思路：

以属性聚集的方式同一主题域中不同实体的属性。比如对于会员、公司、客户等等实体对象我们都有地址属性信息、名称标识属性信息等等，这种思路就是把属性内聚性高的字段整合在一起，并把不同的属性打上类型标识以树表的形式存放。它的优点是：第一，模型稳定性好，外围系统变化了字段，只需要添加不同的类型，不需要进行表结构的变更；第二，减少大量冗余记历史数据。它的缺点是：第一，丢失了很多实体的属性标识信息，我们从模型上将看不到一个会员究竟有哪些地址属性，只能通过查询类型代码才能获取这些信息；第二，它极度的膨胀数据表的记录数，因为它采用竖表的形式存放；第三，应用起来很难，效率是一个大问题，因为我们往往要使用一个实体的多个字段，就会有很多join操作和竖转横的操作。第四：属性聚集也是一件比较难操作的过程，应为这是一个抽象的过程，对建模人员的业务背景知识和抽象能力都提出了很高的要求；第五：虽然减少了冗余的记历史数据，但是记历史的操作也较为复杂。

采用面向对象建模的方式，抽象不同实体的共同属性，然后再一步步采用继承、组合等面向对象的思想具体化实体。他的优点是模型模型概念比较清晰，缺点也是模型相对不是很稳定，整合后的数据的后续应该也面临重新组合的问题。

贴源的建模方式：

采用基本保持源系统的方式进行建模，重点放在数据的标准化，一致化，和数据业务意义的梳理。这种做法和我们目前数据仓库的做法比较类似。它具有实施比较容易，快速实现，前台可以直接使用数据；缺点是整合度不高，模型不稳定。

模型终究是为数据分析应用服务的，具体采用什么方式建模需要根据实际业务特点和源系统的特点决定。的源系统具有变化快，数据分析应该变化快的特点，也要快的特点，而且我们要求不同系统之间整合的需求并不是很大，往往深度的数据整合带来的是应用上的不方便。因此，我个人觉得采用贴源的方式是当前更优的方案。