首页 服务器 宝塔Nginx服务器User-Agent过滤器

宝塔Nginx服务器User-Agent过滤器

用户代理(UserAgent)过滤是一种技术手段,用于在网站或应用中根据访问者的浏览器类型、操作系统或其他特征来决定是否提供特定内容或服务。这种技术通常用于提高用户体验、优化内容展示、防止恶意访问或遵守特定政策。下面是关于用户代理过滤的一些基本概念、方法及其实现方式:..

这些正则表达式规则主要用于Web服务器或安全系统(如WAF)的User-Agent过滤,旨在识别并拦截自动化工具、恶意爬虫、漏洞扫描器等非人类流量,从而提升网站安全性和资源保护。以下是分点总结:
‌核心作用‌

    ‌安全防护‌
        拦截黑客工具(sqlmap, nmap, BurpSuite)防止渗透测试攻击。
        阻止漏洞扫描器(nikto, owasp, Acunetix)减少系统暴露风险。
        屏蔽暴力破解工具(hydra)保护登录接口。

    ‌资源保护‌
        限制数据采集器(HTTrack, Scrapy)防止内容爬取。
        过滤云厂商IP(AWS SDK, DigitalOcean)避免滥用和爬虫干扰。
        拦截AI爬虫(GPTBot, openai)保护版权内容。

    ‌流量优化‌
        放行主流搜索引擎(Googlebot, Bingbot)确保SEO收录。
        阻止低价值爬虫(BLEXBot, DotBot)节省服务器资源。

‌规则分类解析‌
‌类别‌         ‌典型匹配对象‌         ‌示例关键词‌
‌安全扫描工具‌         渗透测试、漏洞扫描         nmap, sqlmap, Metasploit, BurpSuite
‌自动化工具/框架‌         脚本、API调试工具         python-requests, Postman, curl
‌数据爬虫‌         网站镜像、内容采集         HTTrack, webprosbot, SurdotlyBot
‌搜索引擎与商业爬虫‌         SEO友好爬虫 vs 广告分析         Googlebot(允许) vs SemrushBot(拦截)
‌云服务/厂商‌         云服务器IP、监控服务         AWS SDK, YandexBot, Azureus
‌可疑UA特征‌         高风险关键词(如hack, exploit)         hidden, exploit, scan
‌优化建议‌

    ‌去重合并‌
        移除重复项(如nmap同时出现在#安全扫描工具和#关键词过滤1)。

    ‌性能优化‌
        使用锚点(如^Googlebot$)减少误匹配。
        启用正则表达式忽略大小写(/i标志)覆盖变体(如hydra vs Hydra)。

    ‌补充遗漏项‌
        增加新兴AI爬虫(Claude-ai, Midjourney-Bot)。
        补充国内爬虫(如Baiduspider, Sogou)。

    ‌误杀规避‌
        避免通用词(如scan可能误伤合法服务)。
        区分合法工具(如python-requests可能是正常API调用)。

    ‌动态更新机制‌
        定期同步公开威胁情报(如OWASP恶意UA列表)。
        结合IP黑名单和速率限制增强防御。

#关键词过滤1        
(HTTrack|Apache-HttpClient|harvest|audit|dirbuster|pangolin|nmap|sqln|hydra|Parser|libwww|BBBike|sqlmap|w3af|owasp|Nikto|fimap|havij|zmeu|BabyKrokodil|netsparker|httperf| SF/)

#可疑UA特征
(hidden|secret|scan|hack|exploit)
        
#新增扫描器
(zap|arachni|wpscan|skipfish)
        
#社交媒体爬虫
(Twitterbot|facebookexternalhit|Facebot|LinkedInBot)
        
#搜索引擎 & 商业爬虫        
(Googlebot|GoogleOther|Adsbot|Bingbot|DuckDuckBot|Bytespider|zhanzhang\.toutiao|Barkrowler|BLEXBot|MegaIndex|MJ12bot|AhrefsBot|SemrushBot|DataForSeoBot|dataforseo|DotBot|Web-Crawler|ExtLinksBot)

#安全扫描工具
(nmap|hydra|sqln|sqlmap|nikto|w3af|dirbuster|netsparker|havij|owasp|ZAP|BurpSuite|acunetix|nessus|Metasploit)
        
#自动化工具/框架
(Apache-HttpClient|Go-http-client|python-requests|Scrapy|curl|PostmanRuntime|Paw|HTTPie|okhttp|RestSharp)
        
#数据采集器
(HTTrack|harvest|audit|fimap|webprosbot|SurdotlyBot|msray-plus|iaskspider|RepoLookoutBot|CensysInspect)
        
#云服务/厂商
(AWS SDK|Amazonbot|aws-sdk-java|alibaba|YandexBot|DigitalOcean|Linode|Azureus|EC2|GCE)
        
#网络扫描/监控
(Masscan|zmap|Nessus|OpenVAS|SolarWinds|PaloAlto|Sophos|Fortinet|Cisco)
        
#开发调试工具
(Postman|Fiddler|Wget|WinHTTP|Synapse|Electron|PhantomJS|SlimerJS|CefClient)
        
#AI相关        
(ChatGLM|GPTBot|openai|GPT-4|Claude-ai)

#其他常见需要过滤的
(SP-engine|Shuame|Ezooms|FlightDeckReports|InternetMeasurement|WebDAV|WebScarab)
        
#协议库/通用组件
(libwww|libcurl|fasthttp|axios|Java|PHP|Python|Ruby|Perl|Node\.js|Go |\.NET)
        
#桌面/服务器系统
(CrOS|X11; Linux|FreeBSD|ArchLinux|Ubuntu; Mobile)

宝塔防火墙配置方式如下

站心网

这些正则表达式规则主要用于Web服务器或安全系统(如WAF)的User-Agent过滤,旨在识别并拦截自动化工具、恶..

为您推荐

宝塔Nginx配置图片404处理方法

在宝塔面板中配置Nginx,使其在访问图片不存在时显示指定内容或返回自定义404页面,可以通过以下步骤实现:方法一:显示指定内容登录宝塔面板,进入网站管理页面。选择网站,点击需要配置的网站右侧的“设置”按钮。..

判断 nginx 服务是否启动,未启动自动重启 shell脚本

我的是宝塔面板直接上代码nginx_procnum=`ps -ef|grep "nginx"|grep -v grep|wc -l`if [ $nginx_procnum -eq 0 ]then echo "start nginx..." /etc/init.d/nginx startelse echo "no cmd" fi然后添加定时任务;每分钟..

Nginx配置文件(nginx.conf)配置参数详解

Nginx的配置文件nginx.conf配置参数非常多,做网站配置或维护难免需要修改nginx的配置文件,以下针对配置文件中的各种配置参数做出详细的解释,供参考。user nginx nginx ; #Nginx用户及组:用户 组。window下不指定..

Nginx反向代理原理详解

什么是反向代理❓反向代理(Reverse Proxy)是指通过代理服务器来接收Internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给Internet上请求连接的客户端,此时代理服务器对外..

使用docker搭建Nginx + PHP + mysql环境

Nginx+PHP+Mysql是比较常用的网站环境,使用docker布置网站环境也是比较常用的方式,以下就给大家介绍如果使用docker来搭建Nginx+PHP+Mysql的运行环境。前提准备:macOs环境、docker环境(安装docker可以百度,对mac..

通过Linux命令分析Nginx日志得知百度蜘蛛的爬行情况

前言做网站的目的就是将自己的信息展示给目标用户,最直接的就是通过搜索引擎搜索展示。针对搜索引擎也需要优化,也就是我们说的SEO优化,新站长可能会特别关注蜘蛛爬行的次数、频率等,而做好网站SEO优化的第一步就..

使用 Nginx 安装 Vaultwarden 密码管理器并让我们加密

随着在线攻击和网络犯罪的增加,迫切需要为不同的在线服务和帐户安全地生成、存储和管理极其复杂的密码。您可以注册并在几秒钟内开始使用数十种 SaaS 解决方案。对于像我这样的一些用户来说,首选使用自托管应用程序..

如何在 Docker 容器中运行 Nginx 代理管理器

我们都知道 Nginx 代理主机、重定向和 SSL 的手动管理可能很乏味。 Nginx 代理管理器项目最初是 Jamie Curnow 的个人项目,旨在提供一种更简单的方法来创建反向代理主机并使用 Nginx 终止 SSL。该项目具有用于高级代..

Nginx核心开发者Maxim Dounin宣布推出FreeNginx

2024年2月19日,Nginx核心开发者Maxim Dounin宣布推出FreeNginx,这是一个Nginx的开源分叉版本。Dounin表示,他之所以推出FreeNginx,是因为他对Nginx当前所有者F5 Inc.在开发和管理Nginx方面的一些决定感到失望。Do..

介绍 Freenginx,最流行的 Web 服务器的一个分支

Nginx 已被分叉,但它为何以及将如何影响您?Freenginx 是 Nginx 的一个新分支,Nginx 是一种开源 Web 服务器,为三分之一的网站提供支持。这种分拆是否会取代既定的市场领导者,您为什么要关心它?什么是 Nginx?Ng..

Nginx配置ssl证书支持https访问

前言之所以要只用HTTPS,主要是因为 HTTP 是明文传输的,这就造成了很大的安全隐患。在网络传输过程中,只要数据包被人劫持,那你就相当于赤身全裸的暴露在他人面前,毫无半点隐私可言。想象一下,如果你连了一个不..

服务器安全:宝塔nginx1.8-1.17编译云锁安全模块

首先在操作前,请确认已经配置好宝塔面板,并采用编译方法配置的nginx环境!(不是极速安装,是编译安装)并妥善备份Nginx文件,以及确定本教程不适用于非宝塔用户以及apache用户这教程理论上支持nginx1.8-1.17.2,..

发表回复

返回顶部