sitelink1 https://search.naver.com/p/crd/rd?m=1&am...c&cr=3 
sitelink2 https://youtu.be/EfFSZarLy8k?si=ctmEb5xDeIP9o9kJ 
sitelink3  
sitelink4  
sitelink5  
extra_vars6  

소개

2022년에 ChatGPT 3.5가 세상에 공개되었을 때, 저는 그것이 세상을 바꿀 획기적인 일이라고 확신했습니다.

반드시 3.5 버전이 아니라 후속 버전 중 하나일 것입니다. 그리고 그럴 것입니다.

저는 이것을 확신합니다.

이제 2024년이 끝나갈 무렵, 2년이 지났고, 저는 SAP GUI에서 작동하는 자율 에이전트 프로젝트에 대한 개념 증명을 방금 마쳤습니다.

오랫동안 이런 것을 만들고 싶었고, 예상보다 더 간단했습니다.

 

기술

솔직히 말해서, 저는 기술적 측면이 약간 지루하다고 생각합니다.

이 프로젝트에서 가장 중요한 부분은 아닙니다.

그럼에도 불구하고 언급할 가치가 있습니다. 이 프로젝트는 인기 있는 LangGraph 라이브러리를 기반으로 구축되었으며, AI 에이전트를 만드는 데 훌륭한 도구입니다.

이전에는 주로 LangChain으로 작업했기 때문에 저에게는 새로운 것이었습니다.

에이전트의 행동은 내가 개발한 도구에 의해 구동됩니다.

자율적으로 작동하여 순차적인 단계를 밟고 결과를 분석합니다.

거래로 이동, 양식 작성, 버튼 클릭 또는 탭 전환과 같이 여러 작업을 연속으로 수행할 수 있습니다.

게다가 동일한 작업 내에서 여러 거래를 처리할 수 있습니다.

최종 결과를 얻고 사용자에게 응답할 수 있으면 작업을 완료합니다.

이 프로젝트에서 저는 GPT-4o를 대규모 언어 모델로 사용했습니다.

이것은 멀티모달 모델로, 이미지도 분석할 수 있습니다.

그러나 이미지 분석은 비용이 발생하고 비교적 느릴 수 있으므로 최대한 제한하려고 노력했습니다.

그렇긴 하지만 여전히 매우 다재다능합니다.

일부 작업의 경우 에이전트는 스크린샷 없이도 작업을 완료할 수 있습니다.

제 생각에, 에이전트는 번개처럼 빠르며, 특히 이미지 분석이 필요 없는 단계에서는 그렇습니다.

첨부된 비디오에서 직접 판단할 수 있습니다.

 

프로젝트 개발

제가 정말 논의하고 싶었던 것은 이 프로젝트의 진행 상황과 결과입니다.

처음에는 에이전트를 작동시키려면 상당한 지식 기반을 구축해야 한다고 생각했습니다.

저는 다양한 작업에 대한 단계별 지침을 설명하는 문서를 준비할 계획이었습니다.

예를 들어, 시스템에서 런타임 오류를 확인하는 방법이나 사용자를 만들기 위해 어떤 버튼을 눌러야 하는지에 대한 설명이었습니다.

당시에는 이것이 합리적이고 필요한 접근 방식처럼 보였습니다.

프로젝트의 첫 번째 단계는 SAP GUI AI Agent를 위한 도구를 만드는 것이었습니다 .

텍스트 필드를 채우고, 버튼을 누르고, 탭을 전환하는 기능이 필요할 것이라고 생각했습니다.

이것만으로도 개념 증명으로 시작하기에 충분했습니다.

SAP GUI 인터페이스를 완전히 작동시킬 수는 없지만 기본 작업에는 충분합니다.

또한 에이전트가 "주변을 둘러보고" 결과를 분석해야 하기 때문에 스크린샷을 찍는 기능도 추가했습니다.

다음으로, 인터페이스와 상호작용하고 특정 작업을 실행하는 방법에 대한 자세한 지침이 포함된 정교한 프롬프트를 개발할 계획이었습니다.

 

놀라움

저는 매우 기본적인 프롬프트로 에이전트를 실행하고 시스템에서 프로세스를 확인하도록 요청했습니다.

응답을 받았을 때의 제 놀라움을 상상해보세요. 복잡한 인터페이스를 설정하고, 누군가를 그 앞에 두고, "작업"이라고 말하는 것과 비슷했습니다.

그리고 그 사람은 주저하지 않고 마치 이미 익숙한 것처럼 인터페이스를 사용하기 시작했습니다.

물론, 저는 대규모 언어 모델이 광범위한 지식을 가지고 있고 따라서 대부분의 SAP 트랜잭션에 익숙하다는 것을 알고 있습니다.

하지만 때때로 이러한 모델이 점들을 연결하는 능력은 정말 놀랍습니다.

 

이 현상은 어디로 향하는가?

저는 이것이 프로젝트의 아주 초기 단계라는 것을 충분히 알고 있습니다.

스스로를 속이지 맙시다. 제가 제 에이전트에게 할당한 작업은 상급 레벨이 아닙니다.

그러나 인공 지능이 발전하는 속도를 생각해 보세요.

몇 달 전에는 불가능했던 일이 이제는 완전히 자연스러워졌습니다.

점점 더 작은 모델이 점점 더 지능화되고 있습니다.

진행 속도가 번개처럼 빠릅니다.

1년 후 제 에이전트가 서비스 데스크에서 일하고 인간만큼 효과적으로 수행할 수 있을까요?

그리고 시간이 지나면서 SAP 컨설턴트를 대체할 수도 있을까요?

물론 SAP GUI는 기계에 이상적인 인터페이스가 아닙니다.

현재 우리는 인공 지능에게 우리가 사용하는 인터페이스를 사용하도록 가르치고 있습니다.

우리는 그것을 우리 세계에 맞게 조정하고 있습니다.

이는 인간형 로봇의 경우에서 분명합니다.

그들은 인간과 닮아서 같은 환경에서 작동할 수 있도록 설계되었습니다.

하지만 이것이 정말 최적일까요? 이것이 정말 로봇에 가장 적합한 형태일까요? 아마도 단지 과도기적 단계일 뿐입니다.

우리가 사용하는 인터페이스를 사용하는 에이전트에도 마찬가지입니다.

미래에는 에이전트가 API를 통해 통신하거나 SAP의 경우 RFC를 통해 통신할 가능성이 높습니다.

그리고 우리는 그것을 점점 덜 이해하게 될 것입니다.

 

이미 당신의 목에 자율 SAP 컨설턴트 의 숨결을 느끼셨나요 ? 댓글로 생각을 공유하고, 영상도 꼭 보세요!

 

 

번호 제목 글쓴이 날짜 조회 수
공지 Software Development Trend (with Java) 황제낙엽 2024.01.19 592
152 SBOM(Software Bill of Materials) & FOSSLight 황제낙엽 2025.04.04 34
151 현재 유행하는 AI 들을 이용하는 방법 황제낙엽 2025.01.31 55
» SAP GUI AI Agent를 생성했습니다. 황제낙엽 2025.01.12 65
149 프로그래밍에서 polling 의 의미 황제낙엽 2025.01.05 71
148 [Gemini] server 에서 client 의 function call 를 위한 방안과 특징 황제낙엽 2025.01.03 53
147 Gretty 와 Jetty 에 대하여 황제낙엽 2024.11.01 115
146 naver(네이버) developers에서 제공하는 OAuth REST API 관련 링크 황제낙엽 2023.12.31 98
145 (bing) 소프트웨어의 일반적인 버전 관리 규칙 황제낙엽 2023.10.24 72
144 kakao(카카오) developers에서 제공하는 OAuth REST API 관련 링크 황제낙엽 2023.10.22 107
143 식품(상품) 바코드를 조회하여 제품 정보 획득하기 file 황제낙엽 2023.08.07 286
142 식약처(식품의약품안전처) 공공데이터 API 황제낙엽 2023.08.07 124
141 서비스 이용약관과 개인정보 처리방침 황제낙엽 2023.07.15 66
140 프로젝트 운영 관리 소프트웨어로 100% 자동화된 '데브옵스(DevOps)' 구축하기 (LG CNS) secret 황제낙엽 2023.07.12 65
139 개발자이기 전에 노동자로써의 삶에 대한 고찰 (지극히 개인적인 사설) 황제낙엽 2023.02.28 104
138 [SDC22 키노트 요약정리] 더 쉽게, 끊김 없이 매끄럽게! ‘캄 테크’ 향해 진화하는 미래의 집 황제낙엽 2022.12.24 133
137 변수 네이밍 표기법 종류 file 황제낙엽 2022.11.30 81
136 이미지에서 텍스트를 추출하는 OCR 방법들 file 황제낙엽 2022.09.23 110
135 지수(과학적 표기법, "E") 서식 지정자 (2) 황제낙엽 2021.07.06 139
134 REST API 제대로 알고 사용하기 황제낙엽 2021.06.02 130