多线程访问

您所在的位置:网站首页 巨人图片卡通可爱头像 多线程访问

多线程访问

2023-10-08 07:48| 来源: 网络整理| 查看: 265

 一、目录

环境及需求 问题 解决方案

 二、环境及需求

  

  

  每个任务都会有1万线程访问这个方法,这个方法里面又会访问验证码验证服务的方法,这样就会解开验证码限制,后续的访问达成有效访 问。然后过了一个时间单位,访问又会受限,多个线程同时请求验证码验证服务,解封后,后面的访问就会正常。这样一直循环。

  因为验证码服务收费,并且解封一次后续就可正常访问。怎样让这1万个并发线程进入方法后,队列去请求验证码服务,请求成功后其它线程不访问验证码服务。

 1、这里用示例程序模拟一下环境,模拟1万线程并发请求:

static void Main(string[] args) { int count = 10000; List urls = PageSourceController.GetUrls(count); List products = PageSourceController.CollectedProducts(urls); }

 

2、模拟count=10000个url

public static List GetUrls(int count) { List urls = new List(); for (int index = 0; index < count; index++) { string url = string.Format("http://congcong.jd.com/{0}.html", index + 1); if (!urls.Contains(url)) urls.Add(url); } return urls; }

 

3、根据上面获取到1万个url集合进行并发请求

public static List CollectedProducts(List urls) { //一万线程并发 System.Threading.Tasks.Parallel.ForEach(urls, u => { PageSourceController.GetProductInfo(u); // ...... // do something... }); return null; }

 

4、并发请求的方法GetProductInfo(string url)

//根据URL获取商品详细信息 public static string GetProductInfo(string url) { //请求--返回封ip的情况 string html = PageSourceController.GetPageSource(url); //封IP情况 if (!string.IsNullOrEmpty(html) && html.Contains("Input CheckCode")) { string imgurl = "http://img5.congcong.com/jjooxx.jpg";

        //---------------------------------[分割线]-------------------------------------------------

//解析验证码--这是重点:解析验证码收费,但是现在是多线程并发,如果封ip,同时会有许多线程同时进入请求,花费较大 string result = CheckCodeServer.GetCheckCode(imgurl); if (!string.IsNullOrEmpty(result)) { //获取解析后的验证码,重新提交请求,获取正确的商品信息 html = PageSourceController.PostCheckCodeData(result, url); }        //---------------------------------[/分割线]------------------------------------------------- } return html; }

 

5、请求和提交方法

public static string GetPageSource(string url) { return "CheckCodeFlag:Input CheckCode"; } public static string PostCheckCodeData(string resultCheckCode, string url) { string html = "解封成功并成功请求回正确的商品信息:XXOOXX-XXOOXX"; ; return html; }

 综上所述,现在的问题就是如何在并发请求验证服务时,如何保证验证服务(分割线内的内容)只能进入一次。后面的其它线程都不进入。

 

三、解决方案

1)加锁

首先,定义一个锁

public class LockKey { public bool flag { get; set; } }

 

然后,创建一个锁

public static LockKey lockkey = new LockKey() { flag = false };

其次,使用此锁

public static string GetProductInfo(string url) { //请求 string html = PageSourceController.GetPageSource(url); //封IP情况 if (!string.IsNullOrEmpty(html) && html.Contains("Input CheckCode")) { string imgurl = "http://img5.congcong.com/jjooxx.jpg";          //默认为flase if (!lockkey.flag) { lock (lockkey) { //解析验证码 string result = CheckCodeServer.GetCheckCode(imgurl); if (!string.IsNullOrEmpty(result)) { //解封 html = PageSourceController.PostCheckCodeData(result, url); lockkey.flag = true; } } } } return html; }

 

问题:运行程序发现,还是有多个线程同时进入

原因:判断在锁的外层,这样同时会有多个线程首先获取到flag=false,这样就会有多个符合条件的线程进入。

解决:调整锁的位置

//根据URL获取商品详细信息 public static string GetProductInfo(string url) { //请求 string html = PageSourceController.GetPageSource(url); //封IP情况 if (!string.IsNullOrEmpty(html) && html.Contains("Input CheckCode")) { string imgurl = "http://img5.congcong.com/jjooxx.jpg"; lock (lockkey) { if (!lockkey.flag) { //解析验证码 string result = CheckCodeServer.GetCheckCode(imgurl); if (!string.IsNullOrEmpty(result)) { //解封 html = PageSourceController.PostCheckCodeData(result, url); lockkey.flag = true; } } } } return html; }

 

问题:第一次进入后修改flag=true,后面的线程确实不会进入,页面也会正常请求访问。正常请求访问的情况下不会走下面里面的方法。

if (!string.IsNullOrEmpty(html) && html.Contains("Input CheckCode")) { //验证码解析验证 }

 

但是如果,访问又一轮被封ip它就会进入这个方法,但是之前我们已经给静态l对象的ockkey.flag = true;赋值,这样连下面的方法都不会进入:

lock (lockkey) {           //上一轮已经赋值为true,所以后面所有的所有都不会再进入去验证了,页面也会一直得不到解封。除非关闭程序,重新运行 if (!lockkey.flag) { //解析验证码 string result = CheckCodeServer.GetCheckCode(imgurl); if (!string.IsNullOrEmpty(result)) { //解封 html = PageSourceController.PostCheckCodeData(result, url); lockkey.flag = true; } } }

问题:那问题又来了,我如何在第一次进入后将 lockkey.flag = true;而且在本轮的所有线程请求结束后将 lockkey.flag = false。我怎样获取最后一个线程都已经结束的标志?

方案:计数?修改得也不少,方法传参也要变;System.Threading.CancellationTokenSource?看书的时候看过,用的不熟,还要现看资料,貌似对于System.Threading.Tasks.Parallel.ForEach不是很管用。怎么办?时间戳?

1、增加锁键属性:

public class LockKey { public bool flag { get; set; } public DateTime datetime { get; set; } }

2、声明锁:

public static LockKey lockkey = new LockKey() { flag = false,datetime=DateTime.Now.AddDays(-1) };

3、使用此锁:

public static LockKey lockkey = new LockKey() { flag = false,datetime=DateTime.Now.AddDays(-1) }; //根据URL获取商品详细信息 public static string GetProductInfo(string url) { //请求 string html = PageSourceController.GetPageSource(url); //封IP情况 if (!string.IsNullOrEmpty(html) && html.Contains("Input CheckCode")) { string imgurl = "http://img5.congcong.com/jjooxx.jpg"; lock (lockkey) { TimeSpan ts = DateTime.Now - lockkey.datetime;            //首次进入lockkey.datetime是前一天,时间差肯定大于30分钟 if (ts.TotalMinutes>30) { //解析验证码 string result = CheckCodeServer.GetCheckCode(imgurl); if (!string.IsNullOrEmpty(result)) { //解封 html = PageSourceController.PostCheckCodeData(result, url); }              //首次访问后重置lockkey.datetime时间为当前时间,后续进入的线程时间差小于30分钟,所以就不会进入。              //30分钟后,又被封ip,时间差大于30分钟,又会进入。 lockkey.datetime = DateTime.Now; } } } return html; }

加入时间戳之后,如果封ip就30分钟解封一次。

 Demo下载地址:http://yun.baidu.com/share/link?shareid=882934955&uk=4027290153



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3