반응형
블로그 이미지
개발자로서 현장에서 일하면서 새로 접하는 기술들이나 알게된 정보 등을 정리하기 위한 블로그입니다. 운 좋게 미국에서 큰 회사들의 프로젝트에서 컬설턴트로 일하고 있어서 새로운 기술들을 접할 기회가 많이 있습니다. 미국의 IT 프로젝트에서 사용되는 툴들에 대해 많은 분들과 정보를 공유하고 싶습니다.
솔웅

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

카테고리


반응형

이 추론 방법론 비교 마지막회 작업을 하다가 AI 모델 순위를 바꿔 버렸습니다.

작업 하던 중 일론 머스크가 Grok 3 를 발표 했거든요.
써 보고 그냥 그런가 보다 했었는데, 추론 모델인 DeepSearch 모델을 사용해 보고 나서는 ㄷㄷㄷ.

일론 머스크 너는 도대체......

지난 시간에 다뤘던 일반 AI 모델들 보다 역시 AI 추론 모델들의 답변이 훨씬 Quality 가 높습니다.

공부를 할 때는 이 AI 추론 모델을 사용해야 할 것 같습니다.

ChatGPT o1, DeepSeek R1 그리고 Grok 3 DeepSearch 모델들이 답한 CoT (Chain of Thought), ReAct (Reasoning & Acting), PS (Plan and Solve) 그리고 ReWOO (Reasoning without Observation) Research 자료로 공부 합니다.

그리고 각 AI 추론 모델들의 특징과 강점을 직접 느껴 보세요.

이 비디오에서 정한 순위는 특정 질문에 대한 각 모델들의 답변에 대한 저의 주관적인 평가 입니다.



https://youtu.be/z4bnY7lEOP0?si=YCAls0U6CVMDdAqY

 

 

반응형


반응형

지난 시간의 서론에 이어 오늘은 본격적으로 각 AI 들의 답변을 분석해 봅니다.

질문은 '아래 추론 방법론들을 분석하고 비교하라' 였습니다.

1.  COT (Chain of Thought)
2. ReAct ( Reasoning and Acting)
3. PS (Plan and Solve)
4. ReWOO (Reasoning without Observation)


오늘은 이에 대해 Gemini, Perplexity, Grok, Copilot 그리고 Claude AI 들의 답변을 갖고 공부합니다.

그리고 각 AI 의 특성과 장단점도 알아 봅니다.

비디오에서 정한 순위는 해당 질문에 대한 답변을 보고 저의 주관적인 판단을 기반으로 정한 겁니다.

AI 들의 답변들을 보다 보면 4가지 추론 방법론들의 핵심 내용을 반복해서 공부하게 되서 훨씬 더 효과가 있는 것 같습니다.

게다가 AI 모델들간의 특성도 파악할 수 있구요.

이 추론 방법론들은 AI와 더 잘 소통하는 법을 연구한 논문들을 근거로 만들어 졌습니다.

AI 로부터 더 좋은 답을 얻어내는 기술을 가진 사람들이 AI 시대에 경쟁력이 있을 거라는 것은 당연합니다.

연구자들과 개발자들은 어떻게 AI 로 부터 더 좋은 답을 얻어내려고 할까요?
이 비디오에서 그 단면을 보여드립니다.

https://youtu.be/XkSgND7w-XY?si=kmaSz8Unxm5yYODd

반응형


반응형

이번 비디오는 IT 개발자가 아니더라도 아주 도움이 많이 될거라고 확신합니다.

AI 쪽으로 계속 공부하다 보니까 AI 시대를 어떻게 준비해야 될지 하나 하나 윤곽이 잡혀 가는 것 같습니다.

지금까지의 모든 어플리케이션은 AI 로 새로 태어날 것입니다.

그리고 AI 는 자연어 (일상 언어)로 프로그래밍 하는 겁니다.

질문이 좋으면 답이 좋습니다. 남들 보다 더 좋은 답을 얻어내면 경쟁에서 앞서 나갈 수 있습니다.

AI 로부터 좋은 답을 얻기 위한 연구분야가 추론 입니다.

ChatGPT O1, O3 그리고 DeepSeek R1 같은 추론 모델에서 더 좋은 답이 나오는 것을 우리는 쉽게 확인할 수 있습니다.

그래서 

지금까지 배운 추론 방법론들을 총 정리해 보기로 했습니다.
AI를 계속 공부를 하다 보니까 점차 AI 시대를 어떻게 준비해야 될지 감이 잡히는 것 같습니다.

인터넷 시대가 시작할 때 인터넷과 일찍 친해진 사람들은 경쟁 사회에서 유리한 위치를 차지했고 크게 성공한 사람들도 많았습니다.

AI 시대가 시작되는 지금 AI 와 친해지는 방법을 알아야 합니다.
AI 와 커뮤니케이션을 잘 해야 합니다.

AI와의 커뮤니케이션은 자연어를 사용합니다.
그렇다고 말만 잘 하면 AI와 친해 질 수 있는 것은 아닙니다.

AI 와의 커뮤니케이션 방법론들을 연구하는 분야가 바로 추론 분야 입니다.
지금까지 배웠던 추론 방법론들을 좀 더 깊게 분석하고 비교해 보려고 합니다.

CoT (Chain of Thought), ReAce (Reasoning and Acting), PS (Plan and Solve) 그리고 REWOO (Reasoning without Observation) 추론 방법론을 알아 볼 겁니다.

그리고 ChatGPT, DeepSeek, Gemini, Copilot, Perplexity, Grok 그리고 Claude 등 주요 AI 모델들에게 같은 질문을 하고 그 답변을 비교 분석해 보겠습니다.

이 첫번째 비디오는 IT 개발자가 아니더라도 AI 와 친해지는 방법이 궁금하신 분들 그리고 AI 시대를 어떻게 준비해야 될지 궁금하신 분들 모두에게 도움이 될 겁니다.

 

https://youtu.be/gE4NZ2H98NM?si=8N62mhmDEDv8s46w

 

반응형


반응형

DeepSeek R1, OpenAI o3

요즘 뉴스를 장식하는 hot AI trend 를 보면 추론이라는 말이 많이 나옵니다.

이 추론이 무엇이길래 AI 의 성능을 크게 향상시켰을까요?

 

한국어로는 추론이라는 한 단어로 번역되는데 실제로 영어에서는 두가지 종류가 있습니다.

 

Inference 와 Reasoning 입니다.

 

DeepSeek R1 과 OpenAI o3 등 추론 기능을 강화한 AI 모델들은 Inference 부분을 강화 한 모델들입니다.

 

AI 모델에서 뿐만 아니라 LangGraph 와 같은 AI  어플리케이션을 만드는 Tool 에서도 이 추론기능을 사용하여 성능을 높이거나 더 user friendly 한 서비스를 제공하는 방법론이 있습니다.

 

거기서 말하는 추론은 Reasoning 에 더 가깝습니다. 

 

오늘은 이 AI 의 추론 기능을 다루는 LangGraph의 Planning Agents tutorial 들을 공부하기에 앞서 추론이란 무엇인지, Inference 와 Reasoning 의 차이는 무엇인지 그리고 이 기능을 개발할 수 있도록 만든 이론적인 성과물들은 무엇인지 등에 대해 설명드립니다.

 

https://youtu.be/KpBnknONb48?si=nZU6cHeXTzLNCbyn

 



반응형


반응형

오늘은 with_structured_output() 에 대해 알아 봅니다.

이 비디오는 LangGraph 에서 제공하는 Youtube Tutorial 입니다.

 

LangGraph 의 Multi Agent Architecture 중 Supervisor Architecture 를 공부하던 중 이 메소드가 나와서 Research를 좀 했습니다.

 

Supervisor Architecture 소스코드를 분석하기 전에 이 메소드를 먼저 공부하고 들어가면 훨씬 이해하기 쉬울 겁니다.

 

https://youtu.be/7hm3_DV1lz4

 

원본 비디오는 여기에 있습니다. 

: https://youtu.be/0i9NzY_b3pg?si=ISieTuJSOGVqcX0a

 

 

그리고 Web Document 는 아래에 있습니다.

: https://langchain-ai.github.io/langgraph/how-tos/react-agent-structured-output/

 

How to return structured output with a ReAct style agent

Home How-to Guides LangGraph Other How to return structured output with a ReAct style agent You might want your agent to return its output in a structured format. For example, if the output of the agent is used by some other downstream software, you may wa

langchain-ai.github.io

 



반응형


반응형

2024년도에 AI Web App 개발 분야에서 떠오르는 기술입니다.
Agentic Workflow, Multi Agent Collaboration 등등 많은 이론과 기술들이 쏟아지고 있습니다.

LangChain에서는 LangGraph라고 하는 별도의 Framework를 만들어서 이 Agentic Workflow, Multi Agent Collaboration 개념과 기술을 AI Application에 구현할 수 있도록 지원하고 있습니다.

오늘 그 AI Agent를 사용해 첫번째 AI Web App을 만들어 보겠습니다.
기본을 탄탄하게 다져 놓으면 어려운 문제가 닥쳐도 쉽게 풀어 낼 수 있습니다. 이 AI Agent 기본은 LangChain에 있는 API Service 들을 사용합니다.

AI Agent 의 기본을 오늘부터 다져 나가겠습니다.

 

https://youtu.be/Yy0DVD2PlYY?si=gIkT3fcWFIEmOJWs

 



 

 

 

반응형


반응형
제 채널의 비디오들은 처음에 Deep Learning을 이해하기 위한 7개이 비디오를 올렸습니다. (DL Fundamental 이라는 Playlists에 모아 놓았습니다.)
Deep learning Fundamental에서부터 ChatGPT등 요즘 많이 등장하는 LLM들을 만든 Transmer model 까지 다뤘습니다.
그 다음 세트는 AI를 사용한 Web 개발의 기초가 되는 8개의 비디오를 올렸습니다. (AI Web App Development 라는 Playlists에 모아 놓았습니다.)
여기에서는 RAG (Retrieval Augmented Generation)이라는 개념이 등장하고 이것을 구현하는 방법을 배웠습니다. RAG는 쉽게 말해 LLM 이외에 다른 tool들을 함께 사용하는 기술입니다.
이제부터는 한 단계 더 올라간 AI Web 개발 관련된 기술을 배울 겁니다.
2024년 들어서 주목 받는 개념입니다.
Agentic Workflow, Multi Agent programming 등의 용어들이 많이 등장하고 여기에서 사용되는 주요 개념은 Agent 입니다.
즉 앞으로의 과정을 잘 이해하기 위해서는 Agent란 무엇인가를 이해하는 것이 아주 중요합니다.
IBM에서 만든 이 What are AI Agents? 라는 비디오가 AI Agent란 무엇인가를 아주 잘 설명한 것 같습니다.
그래서 한글 자막을 덧붙여서 소개해 드립니다.
참고로 저 강사님이 전체 강의 중 가장 광대뼈가 많이 올라간 순간은 자신의 휴가 얘기를 할 때 입니다. ;)
 
 

 

In the initial phase of my channel, I uploaded seven videos designed to introduce the fundamentals of Deep Learning. These videos are compiled in the "DL Fundamentals" playlist. This series covers everything from the basics of Deep Learning to advanced topics like the Transformer model, which underpins modern Large Language Models (LLMs) such as ChatGPT.
Following this, I released a set of eight videos that lay the groundwork for AI-driven web development, available in the "AI Web App Development" playlist. In this series, we delve into the concept of Retrieval Augmented Generation (RAG), exploring how to implement this technique, which integrates various tools alongside LLMs.
Now, we are progressing to more advanced AI web development technologies that have gained prominence in 2024. Key concepts like Agentic Workflow and Multi-Agent Programming will be discussed, with a particular focus on understanding the role of Agents.
To grasp these upcoming lessons effectively, it is crucial to understand what an Agent is. IBM's video "What are AI Agents?" provides an excellent explanation of this concept. I’ve included Korean subtitles for your convenience.
On a lighter note, the instructor's most enthusiastic moment occurs when she shares stories about her vacation. ;)

 

반응형
이전 1 다음