모든 웹사이트를 사용할 수 있는 AI 에이전트를 구축하는 방법
AI 에이전트를 웹에 연결: 개발자의 여정과 컴퓨터 사용의 증가
지난 2년 동안 AI 에이전트 개발의 주요 장애물 중 하나는 안정적인 웹 액세스 권한 부여였습니다. 이메일을 보내도록 설계된 AI 에이전트를 생각해 보세요. 이를 Gmail이나 Outlook에 어떻게 연결합니까? API, 웹사이트, 자율 웹 에이전트? 이 기사에서는 다양한 방법을 살펴봅니다.
API 및 SDK: 제한된 접근 방식
많은 개발자가 API와 SDK를 활용합니다. 이는 짧은 대기 시간과 강력한 인증을 제공하지만 제한 사항이 있습니다.
- API 사용 불가능: 모든 웹 서비스가 API를 제공하는 것은 아닙니다.
- 문서화 문제: 오래되었거나 잘못 작성된 문서가 일반적입니다.
- 기능 격차: API에는 해당 웹사이트의 전체 기능이 부족하여 특정 작업을 방해하는 경우가 많습니다.
다행히도 여러 서비스에서 API 호출 라이브러리를 제공합니다.
- Composio: 강력한 인증을 갖춘 AI 에이전트를 위한 도구를 제공합니다.
- Langchain 도구: Langchain/그래프 에이전트를 위한 리소스
- Apify: 방대한 커뮤니티 기반 API 라이브러리
그러나 보편적인 웹 서비스 접근을 위해서는 API를 넘어서야 합니다.
웹사이트 상호작용: 인간적 접근 방식
신뢰할 수 있는 AI 에이전트 웹사이트 상호작용을 통해 모든 웹 기반 인간 작업을 자동화할 수 있습니다. 그런데 어떻게요?
많은 개발자가 처음에는 Selenium이나 Playwright와 같은 브라우저 테스트 프레임워크를 사용합니다. 그러나 이 접근 방식은 다음과 같은 과제에 직면해 있습니다.
- 취약성: 웹사이트 변경(예: A/B 테스트)으로 인해 스크립트가 쉽게 중단됩니다.
- 탐지 가능성: 테스트 브라우저는 쉽게 식별되고 차단됩니다.
- 프로덕션 배포: 브라우저 호스팅, 인증 관리, 프록시 순환은 프로덕션에서 복잡합니다.
이러한 문제를 해결하기 위해 우리는 다음과 같은 브라우저 SDK를 실험했습니다.
- 깨지기 쉬운 CSS 선택기 대신 자연어 선택기(예:
get_element("find the login button")
)를 사용합니다. - 내장 인증을 통합합니다.
- 차단을 방지하기 위해 회전 프록시가 내장되어 사전 구성된 원격 호스팅을 제공합니다.
현재 오픈 소스(Dendrite SDK)인 이 작업은 더 이상 적극적으로 개발되지 않지만 연구 및 적용이 가능합니다. 유사한 대안은 다음과 같습니다.
- AgentQL: Python 라이브러리
- 스테이지핸드: JavaScript/TypeScript 라이브러리
컴퓨터 사용: 웹 AI 에이전트의 미래는?
Rich Sutton의 'Bitter Lesson'은 향상된 컴퓨팅으로 확장 가능한 일반화 가능한 AI 솔루션의 우위를 강조합니다. Anthropic의 Computer Use는 이 원칙을 구현하여 LLM이 마우스 및 키보드 입력을 사용하여 컴퓨터/브라우저를 직접 제어할 수 있도록 하여 스크립트 및 API 호출이 필요하지 않도록 합니다. 그들의 접근 방식은 작업별 도구보다 일반적인 컴퓨터 기술을 강조합니다. 이는 가장 다재다능한 AI 에이전트가 인간처럼 웹과 직접 상호 작용할 것임을 시사하는 Bitter Lesson과 완벽하게 일치합니다. 초기 결과는 잘 만들어진 프롬프트를 사용하여 복잡한 작업에서 높은 신뢰성을 보여주며 종종 Anthropic의 프롬프트 개선 기능을 통해 향상됩니다.
결론: 미래를 품다
API는 여전히 가치가 있지만 미래에는 대부분의 AI 에이전트에 대해 컴퓨터 사용과 유사한 접근 방식이 선호될 가능성이 높습니다. 상담원이 로그인하여 웹사이트의 검색 기능을 사용하여 상위 결과에서 결론을 추출할 수 있다면 왜 API를 통해 전체 데이터베이스에 의존합니까? AI 개발자의 질문은 이러한 일반화 가능한 접근 방식을 수용할지, 아니면 보다 전문적인 방법의 한계에 직면할지 여부입니다.
참고: 이것은 내 첫 번째 개발자 게시물입니다. 향후 게시물 개선에 대한 피드백을 환영합니다. AI 에이전트나 AI 기반 작업 자동화에 대한 질문도 권장됩니다.
위 내용은 모든 웹사이트를 사용할 수 있는 AI 에이전트를 구축하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

Python은 게임 및 GUI 개발에서 탁월합니다. 1) 게임 개발은 Pygame을 사용하여 드로잉, 오디오 및 기타 기능을 제공하며 2D 게임을 만드는 데 적합합니다. 2) GUI 개발은 Tkinter 또는 PYQT를 선택할 수 있습니다. Tkinter는 간단하고 사용하기 쉽고 PYQT는 풍부한 기능을 가지고 있으며 전문 개발에 적합합니다.

Python은 배우고 사용하기 쉽고 C는 더 강력하지만 복잡합니다. 1. Python Syntax는 간결하며 초보자에게 적합합니다. 동적 타이핑 및 자동 메모리 관리를 사용하면 사용하기 쉽지만 런타임 오류가 발생할 수 있습니다. 2.C는 고성능 응용 프로그램에 적합한 저수준 제어 및 고급 기능을 제공하지만 학습 임계 값이 높고 수동 메모리 및 유형 안전 관리가 필요합니다.

제한된 시간에 Python 학습 효율을 극대화하려면 Python의 DateTime, Time 및 Schedule 모듈을 사용할 수 있습니다. 1. DateTime 모듈은 학습 시간을 기록하고 계획하는 데 사용됩니다. 2. 시간 모듈은 학습과 휴식 시간을 설정하는 데 도움이됩니다. 3. 일정 모듈은 주간 학습 작업을 자동으로 배열합니다.

Python은 개발 효율에서 C보다 낫지 만 C는 실행 성능이 높습니다. 1. Python의 간결한 구문 및 풍부한 라이브러리는 개발 효율성을 향상시킵니다. 2.C의 컴파일 유형 특성 및 하드웨어 제어는 실행 성능을 향상시킵니다. 선택할 때는 프로젝트 요구에 따라 개발 속도 및 실행 효율성을 평가해야합니다.

파이썬은 자동화, 스크립팅 및 작업 관리가 탁월합니다. 1) 자동화 : 파일 백업은 OS 및 Shutil과 같은 표준 라이브러리를 통해 실현됩니다. 2) 스크립트 쓰기 : PSUTIL 라이브러리를 사용하여 시스템 리소스를 모니터링합니다. 3) 작업 관리 : 일정 라이브러리를 사용하여 작업을 예약하십시오. Python의 사용 편의성과 풍부한 라이브러리 지원으로 인해 이러한 영역에서 선호하는 도구가됩니다.

Pythonlistsarepartoftsandardlardlibrary, whileraysarenot.listsarebuilt-in, 다재다능하고, 수집 할 수있는 반면, arraysarreprovidedByTearRaymoduledlesscommonlyusedDuetolimitedFunctionality.
