Python操作ES的方式及與Mysql資料同步的方法-mysql教程-PHP中文網

Python操作Elasticsearch的兩種方式

mysql和Elasticsearch同步資料

haystack的使用

首頁

資料庫

mysql教程

Python操作ES的方式及與Mysql資料同步的方法

王林

Jun 01, 2023 pm 09:49 PM

mysql python es

Python操作Elasticsearch的兩種方式

# 官方提供的：Elasticsearch
# pip install elasticsearch
# GUI：pyhon能做图形化界面编程吗？
	-Tkinter
  -pyqt
# 使用（查询是重点）
# pip3 install elasticsearch
https://github.com/elastic/elasticsearch-py
from elasticsearch import Elasticsearch
obj = Elasticsearch([&#39;127.0.0.1:9200&#39;,&#39;192.168.1.1:9200&#39;,&#39;192.168.1.2:9200&#39;],)
# 创建索引（Index）
# body:用来干什么？mapping：{},setting:{}
# result = obj.indices.create(index=&#39;user&#39;,ignore=400)
# print(result)
# 删除索引
# result = obj.indices.delete(index=&#39;user&#39;, ignore=[400, 404])
# 插入和查询数据（文档的增删查改），是最重要
# 插入数据
# POST news/politics/1
# {&#39;userid&#39;: &#39;1&#39;, &#39;username&#39;: &#39;lqz&#39;,&#39;password&#39;:&#39;123&#39;}
# data = {&#39;userid&#39;: &#39;1&#39;, &#39;username&#39;: &#39;lqz&#39;,&#39;password&#39;:&#39;123&#39;}
# result = obj.create(index=&#39;news&#39;, doc_type=&#39;politics&#39;, id=1, body=data)
# print(result)
# 更新数据
&#39;&#39;&#39;
不用doc包裹会报错
ActionRequestValidationException[Validation Failed: 1: script or doc is missing
&#39;&#39;&#39;
# data ={&#39;doc&#39;:{&#39;userid&#39;: &#39;1&#39;, &#39;username&#39;: &#39;lqz&#39;,&#39;password&#39;:&#39;123ee&#39;,&#39;test&#39;:&#39;test&#39;}}
# result = obj.update(index=&#39;news&#39;, doc_type=&#39;politics&#39;, body=data, id=1)
# print(result)
# 删除数据
# result = obj.delete(index=&#39;news&#39;, doc_type=&#39;politics&#39;, id=1)
# 查询
# 查找所有文档
# query = {&#39;query&#39;: {&#39;match_all&#39;: {}}}
#  查找名字叫做jack的所有文档
# query = {&#39;query&#39;: {&#39;match&#39;: {&#39;desc&#39;: &#39;娇憨可爱&#39;}}}
# query = {&#39;query&#39;: {&#39;term&#39;: {&#39;from&#39;: &#39;sheng&#39;}}}
query = {&#39;query&#39;: {&#39;term&#39;: {&#39;name&#39;: &#39;娘子&#39;}}}
# term和match的区别
# term是短语查询，不会对term的东西进行分词
# match 会多match的东西进行分词，再去查询
# 查找年龄大于11的所有文档
# allDoc = obj.search(index=&#39;lqz&#39;, doc_type=&#39;doc&#39;, body=query)
allDoc = obj.search(index=&#39;lqz&#39;, doc_type=&#39;doc&#39;, body=query)
print(allDoc)
import json
print(json.dumps(allDoc))
# print(allDoc[&#39;hits&#39;][&#39;hits&#39;][0][&#39;_source&#39;])
# 如何集成到django项目中：创建索引，提前创建好就行了
# 插入数据，查询数据，修改数据
# query = {&#39;query&#39;: {&#39;term&#39;: {&#39;name&#39;: &#39;娘子&#39;}}}
# allDoc = obj.search(index=&#39;lqz&#39;, doc_type=&#39;doc&#39;, body=query)
# json格式直接返回
# saas ：软件即服务，不是用人家服务，而是写服务给别人用----》正常的开发
# 舆情监测系统：（爬虫）
# 只监控微博---》宜家：微博，百度贴吧，上市公司
# 公安：负面的，---》追踪到哪个用户发的---》找上门了
# qq群，微信群----》舆情监控（第三方做不了，腾讯出的舆情监控，第三方机构跟腾讯合作，腾讯提供接口，第三方公司做）
# 平台开发出来，别人买服务---》买一年的微博关键字监控

登入後複製

ERP：公司財務，供應鏈

某個大公司，金蝶，用友，開發了軟體----」你們公司自己買伺服器---》軟體跑在你伺服器上
saas模式：公司買服務，10年服務----》帳號密碼---」登進去就能操作---》出了問題找用友---》伺服器在別人那---》政務雲，各種雲---所有東西上雲

---政府花錢買的東西---》用友敢洩漏嗎？
---未來的雲端運算---》只能上網---》電腦運算能力有限---》上雲買服務---》運算1 。。。 100 ---》買了運算服務，直接拿到結果

# 第二种使用方式
# https://github.com/elastic/elasticsearch-dsl-py
# pip3 install elasticsearch-dsl
from datetime import datetime
from elasticsearch_dsl import Document, Date, Nested, Boolean,analyzer, InnerDoc, Completion, Keyword, Text,Integer
from elasticsearch_dsl.connections import connections
connections.create_connection(hosts=["localhost"])
class Article(Document):
    title = Text(analyzer=&#39;ik_max_word&#39;, search_analyzer="ik_max_word", fields={&#39;title&#39;: Keyword()})
    author = Text()
    class Index:
        name = &#39;myindex&#39;  # 索引名
    def save(self, ** kwargs):
        return super(Article, self).save(** kwargs)
if __name__ == &#39;__main__&#39;:
    # Article.init()  # 创建映射
    # 保存数据
    # article = Article()
    # article.title = "测试数据"
    # article.author = "egon"
    # article.save()  # 数据就保存了
    #查询数据
    # s=Article.search()
    # s = s.filter(&#39;match&#39;, title="测试")
    # results = s.execute()
    # # 类比queryset对象，列表中一个个对象
    # # es中叫Response，当成一个列表，列表中放一个个对象
    # print(results)
    #删除数据
    # s = Article.search()
    # s = s.filter(&#39;match&#39;, title="测试").delete()
    #修改数据
    s = Article().search()
    s = s.filter(&#39;match&#39;, title="测试")
    results = s.execute()
    print(results[0])
    results[0].title="xxx"
    results[0].save()
    # 其他操作，参见文档

登入後複製

mysql和Elasticsearch同步資料

# 只要article表插入一条数据，就自动同步到es中
# 第一种方案：
	-每当aritcle表插入一条数据（视图类中，Article.objects.create()，update）
  -往es中插入一条
  -缺陷：代码耦合度高，改好多地方
# 第二种方案：
	-重写create方法，重写update方法
  -缺陷：同步操作---》es中插入必须返回结果才能继续往下走
# 第三种方案：
	-用celery，做异步
  -缺陷：引入celery，还得有消息队列。。。
# 第四种方案：（用的最多）
	-重写create方法，重写update方法，用信号存入，异步操作
  -缺陷：有代码侵入
# 第五种方案：（项目不写代码，自动同步），第三方开源的插件
	-https://github.com/siddontang/go-mysql-elasticsearch----go写
  -你可以用python重写一个，放到git上给别人用（读了mysql的日志）
  -跟平台无关，跟语言无关
  -如何使用：
  	-源码下载---》交叉编译---》可执行文件--》运行起来--》配置文件配好，就完事了
    # 配置文件
    [[source]]
    schema = "数据库名"
    tables = ["article"]
    [[rule]]
    schema = "数据库名"
    table = "表明"
    index = "索引名"
    type = "类型名"
  # 缺陷：
  	-es跟mysql同步时，不希望把表所有字段都同步，mysql的多个表对着es的一个类型
  # 话术升级：
  	-一开始同步
    -用了开源插件（读取mysql日志，连接上es，进行同步）
    -用信号自己写的
    -再高端：仿着他的逻辑，用python自己写的，----》（把这个东西开源出来）

登入後複製

haystack的使用

#django上的一個第三方模組---》你使用過的django第三方模組有哪些？
可以在django上實現全文檢索
#相當於orm--》對接es，solr，whoosh
https://www.yisu.com/article/218631.htm
不支援es，6以上版本
haystack Elasticsearch實現全文檢索
es的原生操作：ELasticsearch Elasticsearch-dsl

##Redis補充

#1  只有5种数据结构：
	-多种数据结构：字符串，hash，列表，集合，有序集合
#2  单线程，速度为什么这么快？
  -本质还是因为是内存数据库
  -epoll模型（io多路复用）
  -单线程，没有线程，进程间的通信
#3 linux上 安装redis#下载
  https://redis.io/download/
  #解压
  tar -xzf redis-5.0.7.tar.gz
  #建立软连接
  ln -s redis-5.0.7 redis
  cd redis
  make&&make install
  # bin路径下几个命令：redis-cli,redis-server,redis-sentinel
  # 在任意位置能够执行redis-server 如何做？配置环境变量
#4  启动redis的三种方式
  	-方式一：(一般不用，没有配置文件)
    	-redis-server
    -方式二：（用的也很少）
    	redis-serve --port 6380
    -方式三：（都用这种，配置文件）
    	daemonize yes #是否以守护进程启动
      pidfile /var/run/redis.pid   #进程号的位置，删除
      port 6379    #端口号
      dir "/opt/soft/redis/data"  #工作目录
      logfile 6379.log #日志位置  
      # 启动：redis-server redis.conf1
#5 客户端连接
  redis-cli -h 127.0.0.1 -p 6379
#6 使用场景
  -看md文档

登入後複製

以上是Python操作ES的方式及與Mysql資料同步的方法的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1671

CakePHP 教程

1428

Laravel 教程

1331

PHP教程

1276

C# 教程

1256

Related knowledge

MySQL和PhpMyAdmin：核心功能和功能 Apr 22, 2025 am 12:12 AM

MySQL和phpMyAdmin是強大的數據庫管理工具。 1）MySQL用於創建數據庫和表、執行DML和SQL查詢。 2）phpMyAdmin提供直觀界面進行數據庫管理、表結構管理、數據操作和用戶權限管理。

Python vs. JavaScript：開發環境和工具 Apr 26, 2025 am 12:09 AM

Python和JavaScript在開發環境上的選擇都很重要。 1)Python的開發環境包括PyCharm、JupyterNotebook和Anaconda，適合數據科學和快速原型開發。 2)JavaScript的開發環境包括Node.js、VSCode和Webpack，適用於前端和後端開發。根據項目需求選擇合適的工具可以提高開發效率和項目成功率。

Python vs. C：了解關鍵差異 Apr 21, 2025 am 12:18 AM

Python和C 各有優勢，選擇應基於項目需求。 1)Python適合快速開發和數據處理，因其簡潔語法和動態類型。 2)C 適用於高性能和系統編程，因其靜態類型和手動內存管理。

Golang vs. Python：利弊 Apr 21, 2025 am 12:17 AM

Golangisidealforbuildingscalablesystemsduetoitsefficiencyandconcurrency,whilePythonexcelsinquickscriptinganddataanalysisduetoitssimplicityandvastecosystem.Golang'sdesignencouragesclean,readablecodeanditsgoroutinesenableefficientconcurrentoperations,t

Laravel vs. Python（與框架）：比較分析 Apr 21, 2025 am 12:15 AM

Laravel適合團隊熟悉PHP且需功能豐富的項目，Python框架則視項目需求而定。 1.Laravel提供優雅語法和豐富功能，適合需要快速開發和靈活性的項目。 2.Django適合複雜應用，因其“電池包含”理念。 3.Flask適用於快速原型和小型項目，提供極大靈活性。

在MySQL中解釋外鍵的目的。 Apr 25, 2025 am 12:17 AM

在MySQL中，外鍵的作用是建立表與表之間的關係，確保數據的一致性和完整性。外鍵通過引用完整性檢查和級聯操作維護數據的有效性，使用時需注意性能優化和避免常見錯誤。

比較和對比Mysql和Mariadb。 Apr 26, 2025 am 12:08 AM

MySQL和MariaDB的主要區別在於性能、功能和許可證：1.MySQL由Oracle開發，MariaDB是其分支。 2.MariaDB在高負載環境中性能可能更好。 3.MariaDB提供了更多的存儲引擎和功能。 4.MySQL採用雙重許可證，MariaDB完全開源。選擇時應考慮現有基礎設施、性能需求、功能需求和許可證成本。

SQL與MySQL：澄清兩者之間的關係 Apr 24, 2025 am 12:02 AM

SQL是一種用於管理關係數據庫的標準語言，而MySQL是一個使用SQL的數據庫管理系統。 SQL定義了與數據庫交互的方式，包括CRUD操作，而MySQL實現了SQL標準並提供了額外的功能，如存儲過程和触發器。

See all articles

Python操作ES的方式及與Mysql資料同步的方法

Python操作Elasticsearch的兩種方式

mysql和Elasticsearch同步資料

haystack的使用

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題