美文网首页
2018-05-13第六周 用python httpserve

2018-05-13第六周 用python httpserve

作者: 土豆土豆我是potato | 来源:发表于2018-06-15 00:58 被阅读0次

由于最终的结果要求在前端进行简单的输入测试,因此需要一个api提供doc2vec的调用。

1.数据清洗

def clean_words(data): # 自定义过滤字符 r = u'[a-zA-Z0-9’!"#$¥●·:~%&\'()🍎☆ ─*+,-./:;<=>?@,。?★、…【】┎━━┑ご┃┭┃┖┦│┞┚▁▃▂═╗╮╭╯◥▍◇▄▃▁╰╗║▋▊' \ u'( )()<>《》?“”‘’!✿※[\\]^_`▅{|}~]+' # 利用正则表达式清洗以上字符

ret = re.sub(r, "", data) # 过滤换行符

ret = str.replace(ret, "\n", " ") # 过滤tab符

ret = str.replace(ret, "\t", " ") return ret

2.分词

def divide_words(data): # 打开HMM参数使分词器能够探索新词 隐马尔可夫链

seg_list = jieba.cut(data, HMM=True) return list(seg_list)

3.HTTP Server核心类,相应GET请求,将文本转换成向量

class HTTPServer_RequestHandler(BaseHTTPRequestHandler): # 处理GET请求

def do_GET(self): arr = [] # 解析诸如“url/?content=...”的请求

if '?' in self.path: self.queryString = urllib.parse.unquote(self.path.split('?', 1)[1]) params = urllib.parse.parse_qs(self.queryString) # 解析属性为content的表单及其内容

if "content" in params: content = params["content"][0] arr = model.infer_vector(divide_words(clean_words(content))) # 返回网页的“200”代码

self.send_response(200) # 发送网页header信息

self.send_header('Content-type', 'text/html') self.end_headers() # 返回维度为400的向量,向量之间以“_”连接

ret = ""

for i in range(len(arr) - 1): ret = ret + str(arr[i]) + "_"

if len(arr) != 0: ret = ret + str(arr[-1]) self.wfile.write(bytes(ret, "utf8"))

4. main

if __name__ == "__main__": # 启动服务器

httpd = HTTPServer(('', port), HTTPServer_RequestHandler)

print("Starting simple_httpd on port: " + str(httpd.server_port))

httpd.serve_forever()

相关文章

  • 2018-05-13第六周 用python httpserve

    由于最终的结果要求在前端进行简单的输入测试,因此需要一个api提供doc2vec的调用。 1.数据清洗 def c...

  • 2018-05-13

    2018-05-13· 字数 572· 阅读 73· 日记本 姓名:周富强 公司:厦门大科机械有限公司 日精进打卡...

  • 2018-05-13

    2018-05-13 【雪梅90天践行目标】 【健康】 早睡早起,减重5KG 【个人学习】 1.十周...

  • python Non-ASCII character '\xe6

    今天用itchat示例时用到了python;运行代码如下图: 却发现第六行报错,报错信息如下: 查了查原因 Pyt...

  • 2

    行者励励 2018-05-13 09:10 没有反思的人生不值得过 -苏格拉底 【5月份第二周 周目标及检视完成...

  • 2018  第二次周检视

    行者励励 2018-05-13 09:10 没有反思的人生不值得过 -苏格拉底 【5月份第二周 周目标及检视完...

  • 周反思2018.7.31-2018.8.5

    线上1.0天使班60天践行: 第六周周检视 没有反思的人生不值得过,用行动来改变自己的习惯,用反思的习惯来指导行动...

  • Python从零开始第六章机器学习②逻辑回归实战(2)

    目录 Python从零开始第六章机器学习①逻辑回归实战(1) Python从零开始第六章机器学习②逻辑回归实战(2...

  • 2018-05-18装修材料篇

    你家里的材料真的用的方便吗? 梵客家装青岛公司2018-05-13 墙面装饰材料的选择。家居墙面装饰尽量不要大面积...

  • 数据分析师进阶系列四--统计学知识

    这一期是b站上秦璐七周数据分析师进阶系列视频第六周内容,主要是讲一些统计基础知识。下一章学习Python数据分...

网友评论

      本文标题:2018-05-13第六周 用python httpserve

      本文链接:https://www.haomeiwen.com/subject/lsrueftx.html