꿈 많은 사람의 이야기

Notice

[contact] 컨택 정보 공지

Recent Posts

Recent Comments

Link

07-30 03:07

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (626)

꿈 많은 사람의 이야기

Claude Opus 5 공개 - 성능, 가격, 프롬프트 가이드 정리(Claude code)

Anthropic이 Claude Opus 5를 공개했습니다. 좋은 성능을 싼값에 쓸 수 있게 만든 모델이라는 특징이 두드러집니다.그리고 같은 날 올라온 글이 하나 더 있습니다. Anthropic 기술 스태프 Thariq Shihipar가 쓴 "The new rules of context engineering for Claude 5 generation models"인데요. 이 글에서는 Opus 5와 Fable 5 같은 모델을 위해 Claude Code 시스템 프롬프트의 80퍼센트 이상을 제거했고 자사 코딩 평가에서 측정 가능한 손실이 없었다는 겁니다. 벤치마크 차트보다 이쪽이 실무자에게 더 중요할 것 같고 저도 이 글을 좀 더 관심있게 봤습니다. 클로드 모델 중 Opus 5의 라인업 앤트로픽의 클로드 모..

인공지능(AI)/AI 일반 2026. 7. 28. 18:13

왜 LLM은 일본 문화에 집착할까? LLM에 숨어 있는 문화적·지역적 편향

이 논문은 제목부터가 좀 놀랍다. "왜 모든 LLM은 일본 문화에 집착하는가"라는 물음은 이 논문이 실제로 발견한 현상을 그대로 옮긴 것이다. 지금까지 언어모델의 문화 편향을 다룬 연구들은 대체로 "LLM은 서구, 특히 미국과 유럽 쪽으로 기운다"는 결론을 반복해 왔다. 그런데 이 논문은 지역 정보를 일부러 지운 상태에서 모델에게 문화 질문을 던지고 스스로 장소를 고르게 했더니, 여덟 개의 최신 모델 대부분이 미국보다 오히려 일본을 가장 자주 떠올린다는 사실을 확인했다. 기존 통념을 정면으로 뒤집는 결과다.저자들은 여기서 멈추지 않고 두 가지를 더 파고든다. 하나는 입력 언어가 이 편향을 어떻게 바꾸는지, 다른 하나는 이 편향이 모델 학습의 어느 단계에서 생겨나는지다. 결론부터 말하면, 편향은 사전학습(..

인공지능(AI)/LLM&RAG 2026. 7. 26. 15:33

우리는 AI 에이전트에게 "함께 결정하는 법"을 가르쳤을까

포스팅 개요본 포스팅은 AI 에이전트 상호운용(interoperability) 프로토콜을 다룬 논문 Governance Gaps in Agent Interoperability Protocols: What MCP, A2A, and ACP Cannot Express를 리뷰한 글입니다. 2026년 6월에 공개된 논문(arXiv:2606.31498)으로, 요즘 부쩍 자주 들리는 다섯 개의 에이전트 프로토콜인 MCP, A2A, ACP, ANP, ERC-8004을 하나하나 뜯어보면서 "이 프로토콜들이 과연 에이전트 공동체의 거버넌스를 담을 수 있는가"를 체계적으로 따진 연구입니다.그런데 제목을 보고 "또 프로토콜 비교 논문이겠거니" 하고 넘기기엔 조금 관점이 다릅니다. 이 논문에서는 "우리는 AI 에이전트에게 일하..

인공지능(AI)/AI Agent 2026. 7. 12. 17:57

앤트로픽 Claude Fable 5와 Mythos 5, 왜 출시 사흘 만에 차단됐을까

포스팅 개요이번 포스팅은 2026년 6월에 일어난 Claude Fable 5와 Mythos 5 차단 사건을 정리하는 글입니다. 앤트로픽(Anthropic)이 보안에 특화된 모델 두 개를 6월 9일에 공개했고, 사흘 뒤인 6월 12일에 미국 상무부의 지시로 두 모델이 전 세계에서 막혔습니다. 출시한 회사가 안전을 이유로 잠가 뒀던 모델에 안전장치를 달아 일반에 풀었는데, 사흘 만에 정부가 안보를 이유로 다시 잠근 셈입니다.단순한 출시 해프닝으로 끝날 일이 아닙니다. 강력한 AI 모델이 처음으로 미국 수출 통제의 대상이 됐고, 그 명단에는 KISA, SK텔레콤, 삼성전자, SK하이닉스 같은 한국 기관과 기업의 이름이 올라 있었기 때문입니다. 이 글은 그 사흘 동안 정확히 무슨 일이 있었는지, 그리고 6월 2..

인공지능(AI)/AI 일반 2026. 6. 20. 18:40

AI Agent 시스템의 안전성(Safety)과 보안의 변화(Feat. Claude mythos)

포스팅 개요작년까지만 해도 AI 안전성(Safety)을 이야기할 때 "이 모델이 폭탄 제조법을 알려주느냐", "이 모델이 차별 발언을 하느냐" 같은 단일 응답의 위험에 대한 이야기가 많았었습니다. 모델은 입력에 답하는 함수였고, 평가는 그 답이 얼마나 위험한가에 초점을 맞췄던 것이죠.1년이 더 지난 지금, 무게중심이 옮겨간 것 같습니다. 이제는 우리가 걱정해야 하는 건 모델이 무슨 말을 하느냐가 아니라, 모델이 도구를 들고 무엇을 하느냐인 것 같습니다. 코드를 실행하고, 파일을 읽고, 메일을 보내고, 다른 에이전트와 협업하는 AI Agent 시스템의 시대이기 때문이죠. 그리고 이 에이전트들이 본격적으로 실서비스에 들어가기 시작하면서, 챗봇 시대의 안전 평가 방식이 더 이상 통하지 않는다는 이야기가 점점 ..

인공지능(AI)/AI Agent 2026. 5. 17. 18:51

60줄짜리 AI 코딩 하네스 4가지 원칙 - 카파시 CLAUDE.md(Github star 10만 개)

포스팅 개요2026년 들어 클로드 코드(Claude Code) 생태계에서 가장 화제가 된 GitHub 저장소가 하나 있습니다. 이름은 andrej-karpathy-skills입니다. 카파시가 X(구 트위터)에 올린 짧은 글 한 편에서 영감을 받아 한 개발자가 그 다음 날 만든 저장소인데요(이름만 들으면 안드레이 카파시(Andrej Karpathy)가 직접 만든 공식 저장소처럼 보이지만, 사실은 그렇지 않습니다.) 그런데 이 저장소가 단 한 장의 마크다운 파일을 중심으로 GitHub에서 별 10만 개를 넘기는 폭발적인 반향을 일으켰습니다.저는 이전 글들에서 그동안 클로드 코드의 스킬, 룰, 서브 에이전트이라는 개념을 차례로 다뤄왔습니다. 이번에 살펴볼 카파시 저장소는 그 모든 흐름이 가장 압축된 형태로 구..

인공지능(AI)/AI 일반 2026. 5. 5. 14:49

AI 추론 모델, 길게 생각한다고 좋은 게 아니다 - Think Deep, Not Just Long 논문 리뷰

포스팅 개요본 포스팅은 2026년 2월 구글(Google)과 버지니아 대학(University of Virginia) 공동 연구팀이 발표한 Think Deep, Not Just Long: Measuring LLM Reasoning Effort via Deep-Thinking Tokens 논문을 리뷰하고, 이 연구가 실제 AI 사용자들에게 어떤 의미를 가지는지까지 개인적인 생각을 정리한 포스팅입니다.최근 추론 모델(Reasoning Model)이 AI 업계의 주류로 자리 잡으면서, 이른바 "길게 생각할수록 더 정확하다"는 가정이 업계의 암묵적인 통념이 되었습니다. 그런데 어느 순간부터 그 반대 방향의 연구들이 조금씩 나오기 시작했고, 이 논문도 그 흐름 중 하나인 연구입니다.논문의 핵심 주장을 한 문장으로..

인공지능(AI)/AI Agent 2026. 4. 19. 16:55

Claude code Agents란? - 클로드 코드 커스텀 에이전트 구성하기

포스팅 개요본 포스팅은 Claude Code의 Custom Agents(커스텀 에이전트) 기능에 대해 다루는 글입니다. Claude Code로 복잡한 작업을 하다 보면, 하나의 대화 안에서 코드 탐색, 구현, 테스트, 리뷰를 모두 처리하게 됩니다. 이렇게 하면 컨텍스트 윈도우가 금방 차고, Claude가 앞에서 봤던 내용을 놓치는 경우가 생깁니다. Custom Agents는 이 문제를 해결합니다. 특정 작업을 전담하는 전문 에이전트를 만들어두면, Claude가 해당 작업을 만났을 때 그 에이전트에게 위임합니다. 각 에이전트는 자기만의 컨텍스트 윈도우에서 독립적으로 작동하고, 작업이 끝나면 요약된 결과만 돌려줍니다. 주 대화의 컨텍스트는 깔끔하게 유지되는 것이죠. 이 글에서는 Custom Agents의 기..

인공지능(AI)/AI 일반 2026. 4. 6. 08:29

Claude code rules란? 클로드 코드에 규칙(rules) 설정하는 방법과 예제(Feat. CLAUDE.md)

포스팅 개요본 포스팅은 Claude Code의 Rules 기능에 대해 다루는 글입니다. Claude Code로 작업하다 보면, 매 세션마다 같은 지시를 반복하게 되는 경우가 있습니다. "이모지 쓰지 마", "로그는 이 형식으로 작성해", "테스트는 pytest로 돌려" 같은 것들이죠. 한두 번이면 괜찮지만, 프로젝트가 커지고 팀원이 늘어나면 이런 반복 지시는 꽤 번거로워집니다. Claude Code의 Rules는 이런 문제를 해결합니다. CLAUDE.md 파일이나 .claude/rules/ 디렉토리에 규칙을 작성해두면, Claude가 매 세션 시작 시 자동으로 읽고 따르려 합니다. 다만 이것은 강제 설정이 아니라 컨텍스트로 취급되기 때문에, 지침이 구체적이고 간결할수록 더 일관되게 따릅니다. 한 번 써두..

인공지능(AI)/AI 일반 2026. 3. 30. 08:45

Claude code skills란? - 클로드 코드 스킬 만들기 예제(example)

포스팅 개요본 포스팅은 Claude Code의 Skills 기능에 대해 다루는 글입니다. Claude Code를 사용하다 보면 반복적으로 같은 지시를 내리는 경우가 많습니다. "배포 전에 테스트 돌려줘", "PR 요약해줘", "이 형식으로 로그 남겨줘" 같은 것들이죠. 매번 동일한 프롬프트를 입력하는 건 비효율적이고, 지시 내용이 길어지면 실수가 생기기도 합니다. Claude Code의 Skills는 이런 문제를 해결하기 위해 만들어진 기능입니다. 반복되는 지시사항이나 워크플로우를 SKILL.md 파일로 정의해두면, /skill-name으로 간편하게 호출하거나 Claude가 상황에 맞게 자동으로 불러올 수 있습니다. 쉽게 말해, Claude에게 새로운 능력을 가르쳐주는 기능이라고 보면 됩니다. 이 글에서..

인공지능(AI)/AI 일반 2026. 3. 24. 15:59

Prev 1 2 3 4 ··· 63 Next

목록분류 전체보기 (626)

꿈 많은 사람의 이야기

티스토리툴바