推广 热搜： 公司快速上海中国未来金企业政策教师系统

项目（day01网站流量指标统计）

日期：2024-11-10 作者：xinet caijiyuan 评论：0 移动：http://dfvalve.xrbh.cn/mobile/news/9809.html

核心提示：网站流量指标统计对于网站流量指标统计，一般可以分为如下维度: 1.统计每一天的页面访问量。 2.统计每一天的独立访客数(

网站流量指标统计对于网站流量指标统计，一般可以分为如下维度: 1.统计每一天的页面访问量。 2.统计每一天的独立访客数(按人头数统计) 3.统计每一天的独立会话数(Session) 收集到如上指标之后，可以按时段来分析网站整体的流量情况

项目（day01网站流量指标统计）

在这里插入图片描述

在这里插入图片描述 4.按访客地域统计 5.按统计访客ip地址 6.按来路页面分析

在这里插入图片描述综上，本项目统计的指标总结如下: 1.PV,页面访问量。用户点击一次页面，就算做一个PV，刷新操作也算。我们会统计一天内总的PV

2.UV,独立访客数。按人头来统计，我们会统计一天内有多少不同的用户来访问网站。处理思路:当一名用户访问网站时，后台会为此用户生成一个用户id(uvid),然后将uvid存到用户浏览器的cookie里，待下一次此用户访问时，会携带uvid信息。所以，这个指标实际就是统计一天之内有多少不同的uvid

3.VV,独立会话(Session)数。统计一天之内有多少不同的会话。产生新会话的条件: ①关闭浏览器，再次打开，会产生一个新会话 ②过了会话的操作超时时间(半小时)后,会产生一个新会话

实现思路：当产生一个新会话时，后台会为此会话生成一个会话id(ssid)，然后存到cookie里。所以统计VV，实际上就是统计一天之内有多少不同的ssid。

4.BR，页面跳出率。BR=跳出会话数/总的会话数(VV)跳出会话指的是:只产生一次访问行为的会话。所以BR这个指标可以衡量网站的优良性。这个指标越高，说明对用户的吸引力越低，则需要改进

5.NewCust,新增用户数。今天的某个用户在历史数据中从未出现过，则此用户算作一个新增用户。统计今天的uvid在历史数据中没出现过的数量。假设今天:2019-09-19 历史数据:<2019-09-19

6.NewIp,新增Ip数。统计今天的ip在历史数据中未出现过的个数。

7.AvgDepp,平均的会话访问深度。AvgDeep=总的会话访问深度/总的会话数(VV)其中，总的会话访问深度=每个会话访问深度的求和。每个会话的访问深度=访问多少不同的url地址

8.AvgTime,平均的会话访问时长。AvgTime=总的会话访问时长/总的会话数(VV)其中，总的会话时长=每个会话时长的求和。如何求出每个会话的访问时长。比如: 会话1: A.jsp时间戳1 B.jsp时间戳2 C.jsp时间戳3 会话2: A.jsp时间戳1 B.jsp时间戳2 C.jsp时间戳3

我们可以统计获取打开页面时的时间戳，统计出每个会话的总的访问时长但是在生产环境，计算的理论值要小于真实值，因为最后一个页面的停留时长无法获取。统计每个会话的总时长，即:Max TineStamp- Min TimeStamp

================================

在这里插入图片描述

以上架构服务搭建于zookeeper集群

tomcat配置在这里插入图片描述

在这里插入图片描述 CTRL+s保存配置新建工程访问地址

修改js

前端代码

flume配置

启动（flume要比前端服务先启动）

eclipse中hadoop文件乱码解决在这里插入图片描述

==============================

hive做数据的离线处理 hive启动

1.建立总表(外部表+分区表)，加载和管理所有的字段数据，比如url, urlname,color…等。 2.为总表添加分区信息。 3.建立清洗表(内部表)，清洗出有用的业务字段。 4.从总表中将清洗后的字段数据插入到清洗表 5.建立业务表，用于存储统计后的各个指标，本项目的pv, uv, vv… .

添加分区方式1

方式2 因为以上分区已经添加好，所以先删除

查询数据验证

创建清洗表

将总表数据插入到清洗表方式一

方式2，加了条件----日期

查询清洗表的pv（页面访问量）

用户个数

数据处理分解步骤数据处理 PV：访问量

UV：独立访客数

SV：独立会话数

BR：跳出率

NewIP：新增IP数

NewCust：新增访客数

AvgTime：平均访问时长

AvgDeep：平均访问深度

插入业务表的语句

报错连接拒绝这是因为DataNode 需要访问 MapReduce JobHistory Server，它的默认端口为0.0.0.0:10020 。

解决

运行之后报错

解决(同时做了内存的扩容) yarn.app.mapreduce.am.staging-dir：mapreduce中间数据和准备数据的存储临时目录

结果

本文地址：http://dfvalve.xrbh.cn/news/9809.html 迅博思语资讯 http://dfvalve.xrbh.cn/ , 查看更多

标签： 项目

更多>同类行业资讯

0 条相关评论

新闻列表

企业新闻

推荐企业新闻

推荐图文

推荐行业资讯

点击排行

• 项目总结：企业订单结算系统从0到1	• 语音识别项目简历收集-----机器学习（仅供参考
• 怎样才能找到赚钱的项目？	• 临川旅游商贸中等专业学校迁建工程方案设计，初
• 热门最新版：2022年北京小学生1-6年级体测项目	• 2013年南京大学大学生创新创业训练计划项目（国
• 家庭健身房的打造，以及可完成的训练项目有福	• 创业学习---《预判项目的长期壁垒》--B-3.预判
• 商城项目store 学习小结（6）——修改密码	• 月入过万！轻轻松松新手小白必学的7种简单AI变