Redis BloomFilter Bloom 필터 구현 방법
Bloom 필터 개념
Bloom이라는 남자가 1970년에 Bloom 필터(영어명: Bloom Filter)를 제안했습니다. 실제로는 긴 이진 벡터와 일련의 무작위 매핑 함수입니다. 블룸 필터는 요소가 컬렉션에 있는지 검색하는 데 사용할 수 있습니다. 장점은 일반 알고리즘에 비해 공간 효율성과 쿼리 시간이 훨씬 높다는 점이며, 단점은 일정 수준의 오인식률과 삭제가 어렵다는 점입니다.
블룸 필터 원리
블룸 필터의 원리는 집합에 요소가 추가되면 K개의 해시 함수를 사용하여 해당 요소를 비트 배열의 K개 포인트로 매핑하고 1로 설정하는 것입니다. 검색할 때 이 포인트가 모두 1인지 여부만 확인하면 세트에 있는지 여부를 대략 알 수 있습니다. 이 포인트 중 하나라도 0이면 검사된 요소가 모두 1이면 해당 요소가 없어야 합니다. 그런 다음 체크된 요소일 가능성이 높습니다. 이것이 블룸필터의 기본 아이디어이다.
블룸 필터와 단일 해시 함수 비트맵의 차이점은 블룸 필터가 k개의 해시 함수를 사용하고 각 문자열이 k비트에 해당한다는 점입니다. 이를 통해 충돌 가능성을 줄입니다
캐시 침투
모든 쿼리는 DB에 직접 도달합니다
간단히 말해서 먼저 데이터베이스의 모든 데이터를 In the filter에 로드합니다. , 예를 들어 현재 데이터베이스의 ID는 1, 2, 3
입니다. 그런 다음 ID: 1을 예로 사용합니다. 위 그림에서 3번 해싱한 후 원래 값인 0을 1
으로 3번 변경했습니다. 쿼리를 위해 데이터가 들어왔을 때 id의 값이 1이면 1을 3번 해시하여 3개의 해시 값이 위의 3개 위치와 완전히 동일하다는 것을 알게 됩니다. 1이 필터
이고 그 반대도 다르다면 존재하지 않는다는 뜻입니다. 그렇다면 적용 시나리오는 어디에 있나요? 일반적으로 캐시 고장을 방지하기 위해 사용합니다
간단히 말하면 데이터베이스의 ID는 1로 시작하여 자체적으로 증가합니다. 그러면 인터페이스가 ID로 쿼리된다는 것을 알고 있으므로 음수를 사용하여 쿼리하겠습니다. 이때 캐시에 그런 데이터가 없다는 걸 알게 됐고, 데이터베이스를 확인해봐도 아무것도 나오지 않았다. 요청이 하나 있는데 100, 1,000, 10,000 정도는 어떨까? 귀하의 DB는 기본적으로 이를 처리할 수 없습니다. 이것을 캐시에 추가하면 더 이상 존재하지 않게 됩니다. 그런 데이터가 없다고 판단되면 그냥 데이터를 반환하는 것이 낫지 않을까요? 그거 비어있어?
이거 너무 효과가 좋은데 단점이 뭔가요? 네, 아래를 살펴보겠습니다
블룸 필터의 단점
블룸 필터가 시간과 공간적으로 더 효율적일 수 있는 이유는 판단의 정확성과 삭제의 편의성이 희생되기 때문입니다
컨테이너에는 포함되지 않을 수도 있지만 찾아야 할 요소들이 있는데, 해시 연산으로 인해 k개의 해시 위치에 있는 이들 요소들의 값이 모두 1이기 때문에 오판으로 이어질 수 있다. 오판의 가능성이 있는 요소를 저장하기 위해 화이트리스트를 구축함으로써, 블룸 필터가 블랙리스트를 저장할 때 오판율을 줄일 수 있습니다.
삭제가 어렵습니다. 컨테이너에 배치된 요소는 비트 배열의 k번째 위치에 1로 매핑되며, 삭제 시 다른 요소의 판단에 영향을 미칠 수 있으므로 단순히 0으로 설정할 수는 없습니다. Counting Bloom Filter를 사용할 수 있습니다
FAQ
1. 왜 여러 해시 함수를 사용합니까?
해시 함수를 하나만 사용하면 해시 자체가 충돌하는 경우가 많습니다. 예를 들어 길이가 100인 배열의 경우 하나의 해시 함수만 사용하면 한 요소를 추가한 후 두 번째 요소를 추가할 때 충돌 확률은 1%, 세 번째 요소를 추가할 때 충돌 확률은 2입니다. %... 하지만 두 요소를 추가하면 충돌 확률은 1%입니다. 해시 함수는 요소를 추가한 후 두 번째 요소를 추가할 때 충돌 확률이 10,000분의 4로 감소합니다(4가지 가능한 충돌 상황, 총 상황 수는 100x100)
Go 언어 구현
package main import ( "fmt" "github.com/bits-and-blooms/bitset" ) //设置哈希数组默认大小为16 const DefaultSize = 16 //设置种子,保证不同哈希函数有不同的计算方式 var seeds = []uint{7, 11, 13, 31, 37, 61} //布隆过滤器结构,包括二进制数组和多个哈希函数 type BloomFilter struct { //使用第三方库 set *bitset.BitSet //指定长度为6 hashFuncs [6]func(seed uint, value string) uint } //构造一个布隆过滤器,包括数组和哈希函数的初始化 func NewBloomFilter() *BloomFilter { bf := new(BloomFilter) bf.set = bitset.New(DefaultSize) for i := 0; i < len(bf.hashFuncs); i++ { bf.hashFuncs[i] = createHash() } return bf } //构造6个哈希函数,每个哈希函数有参数seed保证计算方式的不同 func createHash() func(seed uint, value string) uint { return func(seed uint, value string) uint { var result uint = 0 for i := 0; i < len(value); i++ { result = result*seed + uint(value[i]) } //length = 2^n 时,X % length = X & (length - 1) return result & (DefaultSize - 1) } } //添加元素 func (b *BloomFilter) add(value string) { for i, f := range b.hashFuncs { //将哈希函数计算结果对应的数组位置1 b.set.Set(f(seeds[i], value)) } } //判断元素是否存在 func (b *BloomFilter) contains(value string) bool { //调用每个哈希函数,并且判断数组对应位是否为1 //如果不为1,直接返回false,表明一定不存在 for i, f := range b.hashFuncs { //result = result && b.set.Test(f(seeds[i], value)) if !b.set.Test(f(seeds[i], value)) { return false } } return true } func main() { filter := NewBloomFilter() filter.add("asd") fmt.Println(filter.contains("asd")) fmt.Println(filter.contains("2222")) fmt.Println(filter.contains("155343")) }
출력 결과는 다음과 같습니다.
true
falsefalse
위 내용은 Redis BloomFilter Bloom 필터 구현 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

Redis Cluster Mode는 Sharding을 통해 Redis 인스턴스를 여러 서버에 배포하여 확장 성 및 가용성을 향상시킵니다. 시공 단계는 다음과 같습니다. 포트가 다른 홀수 redis 인스턴스를 만듭니다. 3 개의 센티넬 인스턴스를 만들고, Redis 인스턴스 및 장애 조치를 모니터링합니다. Sentinel 구성 파일 구성, Redis 인스턴스 정보 및 장애 조치 설정 모니터링 추가; Redis 인스턴스 구성 파일 구성, 클러스터 모드 활성화 및 클러스터 정보 파일 경로를 지정합니다. 각 redis 인스턴스의 정보를 포함하는 Nodes.conf 파일을 작성합니다. 클러스터를 시작하고 Create 명령을 실행하여 클러스터를 작성하고 복제본 수를 지정하십시오. 클러스터에 로그인하여 클러스터 정보 명령을 실행하여 클러스터 상태를 확인하십시오. 만들다

Redis 데이터를 지우는 방법 : Flushall 명령을 사용하여 모든 키 값을 지우십시오. FlushDB 명령을 사용하여 현재 선택한 데이터베이스의 키 값을 지우십시오. 선택을 사용하여 데이터베이스를 전환 한 다음 FlushDB를 사용하여 여러 데이터베이스를 지우십시오. del 명령을 사용하여 특정 키를 삭제하십시오. Redis-Cli 도구를 사용하여 데이터를 지우십시오.

Redis의 대기열을 읽으려면 대기열 이름을 얻고 LPOP 명령을 사용하여 요소를 읽고 빈 큐를 처리해야합니다. 특정 단계는 다음과 같습니다. 대기열 이름 가져 오기 : "큐 :"와 같은 "대기열 : my-queue"의 접두사로 이름을 지정하십시오. LPOP 명령을 사용하십시오. 빈 대기열 처리 : 대기열이 비어 있으면 LPOP이 NIL을 반환하고 요소를 읽기 전에 대기열이 존재하는지 확인할 수 있습니다.

CentOS 시스템에서는 Redis 구성 파일을 수정하거나 Redis 명령을 사용하여 악의적 인 스크립트가 너무 많은 리소스를 소비하지 못하게하여 LUA 스크립트의 실행 시간을 제한 할 수 있습니다. 방법 1 : Redis 구성 파일을 수정하고 Redis 구성 파일을 찾으십시오. Redis 구성 파일은 일반적으로 /etc/redis/redis.conf에 있습니다. 구성 파일 편집 : 텍스트 편집기 (예 : VI 또는 Nano)를 사용하여 구성 파일을 엽니 다. Sudovi/etc/redis/redis.conf LUA 스크립트 실행 시간 제한을 설정 : 구성 파일에서 다음 줄을 추가 또는 수정하여 LUA 스크립트의 최대 실행 시간을 설정하십시오 (Unit : Milliseconds).

Redis Command Line 도구 (Redis-Cli)를 사용하여 다음 단계를 통해 Redis를 관리하고 작동하십시오. 서버에 연결하고 주소와 포트를 지정하십시오. 명령 이름과 매개 변수를 사용하여 서버에 명령을 보냅니다. 도움말 명령을 사용하여 특정 명령에 대한 도움말 정보를 봅니다. 종금 명령을 사용하여 명령 줄 도구를 종료하십시오.

Redis Counter는 Redis Key-Value Pair 스토리지를 사용하여 다음 단계를 포함하여 계산 작업을 구현하는 메커니즘입니다. 카운터 키 생성, 카운트 증가, 카운트 감소, 카운트 재설정 및 카운트 얻기. Redis 카운터의 장점에는 빠른 속도, 높은 동시성, 내구성 및 단순성 및 사용 편의성이 포함됩니다. 사용자 액세스 계산, 실시간 메트릭 추적, 게임 점수 및 순위 및 주문 처리 계산과 같은 시나리오에서 사용할 수 있습니다.

REDIS 데이터 만료 전략에는 두 가지 유형이 있습니다. 정기 삭제 : 만료 된 기간 캡-프리브-컨트 컨트 및 만료 된 시간 캡-프레임 딜레이 매개 변수를 통해 설정할 수있는 만료 된 키를 삭제하기위한주기 스캔. LAZY DELETION : 키를 읽거나 쓰는 경우에만 삭제가 만료 된 키를 확인하십시오. 그것들은 게으른 불쾌한 말입니다. 게으른 유발, 게으른 게으른 expire, Lazyfree Lazy-user-del 매개 변수를 통해 설정할 수 있습니다.

Debian Systems에서 ReadDir 시스템 호출은 디렉토리 내용을 읽는 데 사용됩니다. 성능이 좋지 않은 경우 다음과 같은 최적화 전략을 시도해보십시오. 디렉토리 파일 수를 단순화하십시오. 대규모 디렉토리를 가능한 한 여러 소규모 디렉토리로 나누어 읽기마다 처리 된 항목 수를 줄입니다. 디렉토리 컨텐츠 캐싱 활성화 : 캐시 메커니즘을 구축하고 정기적으로 캐시를 업데이트하거나 디렉토리 컨텐츠가 변경 될 때 캐시를 업데이트하며 readDir로 자주 호출을 줄입니다. 메모리 캐시 (예 : Memcached 또는 Redis) 또는 로컬 캐시 (예 : 파일 또는 데이터베이스)를 고려할 수 있습니다. 효율적인 데이터 구조 채택 : 디렉토리 트래버스를 직접 구현하는 경우 디렉토리 정보를 저장하고 액세스하기 위해보다 효율적인 데이터 구조 (예 : 선형 검색 대신 해시 테이블)를 선택하십시오.
