线程池

作者: forjie | 来源:发表于2019-06-04 18:06 被阅读0次

线程池 concurrent.futures 使用心得

from concurrent.futures import ThreadPoolExecutor, as_completed

# 下载图片
def save_image(self,
                   img_url,
                   meida_path,
                   ):
        whole_path, file_path = get_img_path(meida_path,
                                                  img_url,
                                                  )

        if whole_path and file_path:
            self.download_img(img_url, whole_path)
        return file_path, whole_path

# 对拿到的url 进行分解,创建本地下载的路径
def get_img_path(self,
                     media_path,
                     img_url,
                     ):
        """
        获取要存取图片的路径,用图片自己的路径
        :param meida_dir:  项目中media的路径
        :param img_url:    图片的url
               eg: https://***/doctor/20190315/4/ca47fcbe8231ac60b152b51ff7183113_100_100.png
        :return:
            whole_path: 本地完整路径
            file_path:  /doctor/20190315/4/ca47fcbe8231ac60b152b51ff7183113_100_100.png
        """
        parse_path = urlparse(img_url).path
        h, file_name = os.path.split(parse_path)
        basename = os.path.join(base_dir, media_path, h[1:])
        whole_path = os.path.join(base_dir, media_path, h[1:], file_name)
        # 如果之前就有,那就不下载   PS:有可能有,但是没有存进数据库
        if os.path.exists(whole_path):
            # todo 在之前就判断url
            return None, None
        try:
            os.makedirs(basename)
            return whole_path, parse_path
        except FileExistsError:
            return whole_path, parse_path
        except Exception as e:
            print(e)

# 拿到路径进行本地下载
def download_img(self,
                     img_url,
                     whole_path):
        """
        下载图片
        """
        if os.path.exists(whole_path):
            return
        res = requests.get(img_url)
        try:
            with open(whole_path, 'wb') as f:
                for chunk in res.iter_content(chunk_size=512):
                    f.write(chunk)
        except Exception as e:
            print('download_exception:%s' % img_url)

# 利用线程池进行多线程下载
def no_name_insert_media(self,
                             url_lst,
                             sql_colums,
                             ):
        with ThreadPoolExecutor(max_workers=max_workers) as executor:
            all_task = [executor.submit(save_image, url, media_path) for url in url_lst]
            col_data = []
            for future in as_completed(all_task):
                file_path, whole_path = future.result()
                if not file_path and not whole_path: continue
                uid, md5sum = self.md5_uuid(whole_path)
                col_data.append([file_path, uid, md5sum])

PS:
1,在创建线程池的时间尽量用

with ThreadPoolExecutor(max_workers=max_workers) as executor

2,带参数的函数,参数放在submit,函数名称的后面,多个一直放在后面就行

executor.submit(save_image, url, media_path)

这里的url和media_path都是参数
3,有些时候你用的多线程,也感觉效率也没有提升,那就是你写的方式有问题

all_task = [executor.submit(save_image, url, media_path) for url in url_lst]
            col_data = []
            for future in as_completed(all_task):

上面这样写,是利用了线程池的
下面这么写,就没有,好像是因为当用result()直接获取值的时候是会阻塞的.

  for item in url_lst:
          img_url = item.get('img_url') if item.get('img_url') else item.get('img')
          if not img_url or check_url(img_url): continue
          file_path, whole_path = executor.submit(self.save_image, img_url, media_path).result()

相关文章

  • java线程池

    线程VS线程池 普通线程使用 创建线程池 执行任务 执行完毕,释放线程对象 线程池 创建线程池 拿线程池线程去执行...

  • java----线程池

    什么是线程池 为什么要使用线程池 线程池的处理逻辑 如何使用线程池 如何合理配置线程池的大小 结语 什么是线程池 ...

  • Java线程池的使用

    线程类型: 固定线程 cached线程 定时线程 固定线程池使用 cache线程池使用 定时调度线程池使用

  • Spring Boot之ThreadPoolTaskExecut

    初始化线程池 corePoolSize 线程池维护线程的最少数量keepAliveSeconds 线程池维护线程...

  • 线程池

    1.线程池简介 1.1 线程池的概念 线程池就是首先创建一些线程,它们的集合称为线程池。使用线程池可以很好地提高性...

  • 多线程juc线程池

    java_basic juc线程池 创建线程池 handler是线程池拒绝策略 排队策略 线程池状态 RUNNIN...

  • ThreadPoolExecutor线程池原理以及源码分析

    线程池流程: 线程池核心类:ThreadPoolExecutor:普通的线程池ScheduledThreadPoo...

  • 线程池

    线程池 [TOC] 线程池概述 什么是线程池 为什么使用线程池 线程池的优势第一:降低资源消耗。通过重复利用已创建...

  • java 线程池使用和详解

    线程池的使用 构造方法 corePoolSize:线程池维护线程的最少数量 maximumPoolSize:线程池...

  • 线程池

    JDK线程池 为什么要用线程池 线程池为什么这么设计 线程池原理 核心线程是否能被回收 如何回收空闲线程 Tomc...

网友评论

      本文标题:线程池

      本文链接:https://www.haomeiwen.com/subject/casrxctx.html