脱了她裤子摸进她的内裤GIF 精品国产三级a∨在线 男人J放进女人的P视频全过程 全黄一级裸片视频 久久精品99国产精品日本 一个人WWW在线观看免费中文 免费天天看片在线观看视频 一直按小豆豆为什么会抖 YW1139.龙物视频在线观看 最近最新中文字幕大全 亚洲成A人无码亚洲成A无码特黄 野花高清在线观看免费动漫 高清日韩美剧在线观看 国产老熟女乱子人伦视频 精品亚洲无码不卡一区二区三区 黄 色 免 费 大 片 爱苹果AV,apgav 伊伊综合在线视频无码 特黄a级日本大片 美丽人妻被按摩中出中文字幕 德国极品少妇videossexhd 国产av无码日韩av无码网站 欧美牲交a欧美牲交vdo 国产日产欧产精品精品蜜芽 毛片电影免费播放 天天做天天爱天天综合网2021 最刺激黄a大片免费无需下载 一级片看看 扒开老师内衣吸她奶头动态图 asian艳丽的少妇pics 边摸边吃奶又黄激烈视频 精品国产免费人成电影在线观看 好紧我太爽了色视频 欧美裸体柔术牲交视频 日本黄色网站 日本人妻久久久中文字幕乱码 欧美亚洲中文字幕 综合亚洲av图片区 色欲影视 免费天天看片在线观看视频 乡村大乱纶肥水不外流 老妇炕上偷老汉视频露脸 欧美一级片免费看 六月丁香综合婷婷 2020国产成人最新视频不卡 亚洲AV永久无码天堂网小说区 美女高潮视频大片免费 精品一卡2卡三卡4卡芒果app 国产曰本清纯AV无码不卡 房东老头揉捏吃我奶头影片

    千鋒教育-做有情懷、有良心、有品質的職業教育機構

    當前位置:首頁  >  IT面試題  >  Python面試題  >  正文

    python庫之文本處理

    來源:千鋒教育
    作者:wjy
    關鍵詞: 廣州 成都
    2022-09-26
    分享

      文本處理

      用于解析和操作簡單文本的庫。

      通用

      difflib – (Python標準庫)幫助進行差異化比較。

      Levenshtein – 快速計算Levenshtein距離和字符串相似度。

      fuzzywuzzy – 模糊字符串匹配。

      esmre – 正則表達式加速器。

      ftfy – 自動整理Unicode文本,減少碎片化。

      自然語言處理

      處理人類語言問題的庫。

      NLTK -編寫Python程序來處理人類語言數據的最好平臺。

      Pattern – Python的網絡挖掘模塊。他有自然語言處理工具,機器學習以及其它。

      TextBlob – 為深入自然語言處理任務提供了一致的API。是基于NLTK以及Pattern的巨人之肩上發展的。

      jieba – 中文分詞工具。

      SnowNLP – 中文文本處理庫。

      loso – 另一個中文分詞庫。

    python庫之文本處理

      瀏覽器自動化與仿真

      selenium – 自動化真正的瀏覽器(Chrome瀏覽器,火狐瀏覽器,Opera瀏覽器,IE瀏覽器)。

      Ghost.py – 對PyQt的webkit的封裝(需要PyQT)。

      Spynner – 對PyQt的webkit的封裝(需要PyQT)。

      Splinter – 通用API瀏覽器模擬器(selenium web驅動,Django客戶端,Zope)。

      多重處理

      threading – Python標準庫的線程運行。對于I/O密集型任務很有效。對于CPU綁定的任務沒用,因為python GIL。

      multiprocessing – 標準的Python庫運行多進程。

      celery – 基于分布式消息傳遞的異步任務隊列/作業隊列。

      concurrent-futures – concurrent-futures 模塊為調用異步執行提供了一個高層次的接口。

      異步

      異步網絡編程庫

      asyncio – (在Python 3.4 +版本以上的 Python標準庫)異步I/O,時間循環,協同程序和任務。

      Twisted – 基于事件驅動的網絡引擎框架。

      Tornado – 一個網絡框架和異步網絡庫。

      pulsar – Python事件驅動的并發框架。

      diesel – Python的基于綠色事件的I/O框架。

      gevent – 一個使用greenlet 的基于協程的Python網絡庫。

      eventlet – 有WSGI支持的異步框架。

      Tomorrow – 異步代碼的奇妙的修飾語法。

      隊列

      celery – 基于分布式消息傳遞的異步任務隊列/作業隊列。

      huey – 小型多線程任務隊列。

      mrq – Mr. Queue – 使用redis & Gevent 的Python分布式工作任務隊列。

      RQ – 基于Redis的輕量級任務隊列管理器。

      simpleq – 一個簡單的,可無限擴展,基于Amazon SQS的隊列。

      python-gearman – Gearman的Python API。

      云計算

      picloud – 云端執行Python代碼。

      http://dominoup.com – 云端執行R,Python和matlab代碼

      網頁內容提取

      提取網頁內容的庫。

      HTML頁面的文本和元數據

      newspaper – 用Python進行新聞提取、文章提取和內容策展。

      html2text – 將HTML轉為Markdown格式文本。

      python-goose – HTML內容/文章提取器。

      lassie – 人性化的網頁內容檢索工具

      WebSocket

      用于WebSocket的庫。

      Crossbar – 開源的應用消息傳遞路由器(Python實現的用于Autobahn的WebSocket和WAMP)。

      AutobahnPython – 提供了WebSocket協議和WAMP協議的Python實現并且開源。

      WebSocket-for-Python – Python 2和3以及PyPy的WebSocket客戶端和服務器庫。

      DNS解析

      dnsyo – 在全球超過1500個的DNS服務器上檢查你的DNS。

      pycares – c-ares的接口。c-ares是進行DNS請求和異步名稱決議的C語言庫。

      計算機視覺

      OpenCV – 開源計算機視覺庫。

      SimpleCV – 用于照相機、圖像處理、特征提取、格式轉換的簡介,可讀性強的接口(基于OpenCV)。

      mahotas – 快速計算機圖像處理算法(完全使用 C++ 實現),完全基于 numpy 的數組作為它的數據類型。

      代理服務器

      shadowsocks – 一個快速隧道代理,可幫你穿透防火墻(支持TCP和UDP,TFO,多用戶和平滑重啟,目的IP黑名單)。

      tproxy – tproxy是一個簡單的TCP路由代理(第7層),基于Gevent,用Python進行配置。

    聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。

    相關推薦

  1. 最新開源:高效的Python通用對象池化庫 接著你需要創建 Pond 的對象: Pond 可以傳遞一些參數進去,分別代表: borrowed_timeout :單位為秒,借出對象的最長期限,超過期限的對象歸還時會自動銷毀不會放入對象池。
  2. 那些隱藏的Pycharm實用小技巧(下) 方法:點擊左上角“File”→點擊“Settings”→找到Project下面的“Python interpreter”→點擊“+”→輸入你想安裝的包的名字,例如“pygame”,然后點擊下面的“Install Package”就開始安裝了,安裝完成就可以用了。
  3. 那些隱藏的Pycharm實用小技巧(上) 快速多行注釋或者取消多行注釋 雖然我們在寫代碼中可以用“#”來進行單行注釋,但如果有多行代碼需要注釋,那么一行一行來敲“#”就有點麻煩,這里我們可以用鼠標選中多行代碼,然后按 Ctrl+/ 就能進行多行代碼的注釋了,同時也可以取消多行代碼的注釋。
  4. 關于框架的選擇誤區 在框架的選擇問題上,許多人很容易就陷入了下面兩個誤區中而不自知:哪個框架最好——世上沒有最好的框架,只有最適合你自己、最適合你的團隊的框架。編程語言選擇也是一個道理,你的團隊Python最熟就用Python好了
  5. web開發的一些框架 Django是一個開源的Web應用框架,由Python寫成,支持許多數據庫引擎,可以讓Web開發變得迅速和可擴展,并會不斷的版本更新以匹配Python最新版本,如果是新手程序員,可以從這個框架入手。
  6. python庫之文本處理 threading – Python標準庫的線程運行。對于I/O密集型任務很有效。對于CPU綁定的任務沒用,因為python GIL?!ultiprocessing – 標準的Python庫運行多進程?!elery – 基于分布式消息傳遞的異步任務隊列/作業隊列。
  7. 四虎成人精品一区二区免费网站