页面组管理
最后更新于
最后更新于
页面组是具有共同结构特征的页面集合,如商品详情页、新闻资讯页;可用于基础指标分析或热图分析。
可以设定一组或多组 URL 规则快速匹配一组具有相同结构的页面,支持 5 种URL规则:包含、开头为、结尾为、等于、正则表达式:
任何包含输入字符串的URL。e.g. 输入URL 包含 abc,则将筛选出 abc.com、ark.abc.cn 等类似的URL;
任何开头为输入字符串的URL。e.g. 输入URL开头为http://www.example.com/category=1,则将筛选出http://www.example.com/category=1&id=1、http://www.example.com/category=1&id=2 等所有分类下的URL;
任何结尾为输入字符串的URL。e.g. 输入URL结尾为 project-management,则将筛选出 http://www.example1.com/project-management 、 http://www.example2.com/project-management 等URL;
和输入URL完全一样的网址,支持输入多个地址;
符合正则表达式的URL,通过通配符、定位符、分组等符号组成逻辑公式。e.g. (?=.*page.*)(?!.*otherpage).* 筛选出包含page 但是不包含 otherpage 的所有页面。
规则中输入多个地址或特征时英文分号分隔
页面组的修改、复制、删除
正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,是对字符串操作的一种逻辑公式。
正则表达式字符主要包含:通配符、定位符、分组等。
通配符,可以用来代替一个或多个字符,常用的有
符号 | 说明 | 示例 |
* | *前的字符重复出现n次(n≥0) | 表达式是 argo*ark 则argoark、argooooark都可以匹配 |
? | ?前的字符重复出现0次或1次 | 表达式是 argo?ark 则只能匹配出argoark、argark |
定位符,基于指定位置的匹配,通常在开始或结束的位置
符号 | 说明 | 示例 |
^ | 从开头匹配字符串 | 表达式是 ^ark 则 ark.analysys.cn、arkargo 可以匹配,但 docs.ark、argoark 等不匹配 |
$ | 以结尾匹配字符串 | 表达式是 ark$ 则 doc.ark.cn、argoark 可以匹配,但 ark.analysys.cn、arkargo 等不匹配 |
更多可参考 https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions
常见用法 | 示例 |
头部域名完全匹配 ,尾部带/或带?加参数 | 表达式:^https:\/\/www.analysys.cn($|\/$|\/\?.*) 能匹配以下页面: https://www.analysys.cn https://www.analysys.cn/ https://www.analysys.cn/?utmsource=xx 不能匹配以下页面: https://www.analysys.c/abc |
头部匹配 http 或 https 协议,并且匹配多个子域名 | 表达式:^(http|https):\/\/(ark|argo|qianfan).analysys.cn 匹配以下页面: http://ark.analysys.cn http://argo.analysys.cn https://ark.analysys.cn https://ark.analysys.cn/?utmsource=xx https://qianfan.analysys.cn 不能匹配以下页面: https://www.analysys.cn |
指定头部匹配规则 | 表达式:^http:\/\/analysys\.cn\/blog.*$ 匹配以下页面: http://analysys.cn/blog http://analysys.cn/blog/ http://analysys.cn/blog/1194 http://analysys.cn/blog/1194#xxx |
匹配 http 或 https开头链接,也可匹配不包含www或将www替换成其它由字母数字组合的子域名的情况 | 表达式:^(http|https):\/\/[a-z0-9]*[.]*analysys.cn\/view\/sign\/signup$ 匹配以下页面: http://www.analysys.cn/view/sign/signup https://www.analysys.cn/view/sign/signup http://analysys.cn/view/sign/signup http://ark.analysys.cn/view/sign/signup https://analysys.cn/view/sign/signup |
匹配末尾数据必须在(10603到10782之间) | 表达式:^http:\/\/analysys.cn\/blog\/10([6][1-9][0-9]|[6][0][3-9]|[7][0-7][0-9]|[7][8][0-2])$ 匹配以下页面: http://analysys.cn/blog/10603 http://analysys.cn/blog/10666 http://analysys.cn/blog/10782 不能匹配以下页面: http://analysys.cn/blog/10884 http://analysys.cn/blog/10103 |
以上内容没有解答我的问题?点击我来反馈 🚀