이걸 왜 이제 알았을까? 바이트댄스가 작정하고 푼 미친 리서치 AI, Deer-Flow 2.0 솔직 리뷰
💡 TL;DR (한 마디로?) 정체: 바이트댄스가 오픈소스로 푼 LangGraph 기반 다중 에이전트(Multi-Agent) 딥 리서치 프레임워크. 특징: 검색 ➡️ 코드 실행 ➡️ 데이터 분석 ➡️ 보고서(심지어 팟캐스트) 생성까지 알아서 다 해줌. 2.0부터는 아예 ‘슈퍼 에이전트’ 샌드박스로 진화함. 결론: 단순 RAG...
💡 TL;DR (한 마디로?) 정체: 바이트댄스가 오픈소스로 푼 LangGraph 기반 다중 에이전트(Multi-Agent) 딥 리서치 프레임워크. 특징: 검색 ➡️ 코드 실행 ➡️ 데이터 분석 ➡️ 보고서(심지어 팟캐스트) 생성까지 알아서 다 해줌. 2.0부터는 아예 ‘슈퍼 에이전트’ 샌드박스로 진화함. 결론: 단순 RAG...
Vision LLM의 ‘Latent Reasoning’, 알고 보니 가짜였다? (충격적인 분석 결과) 📝 메타데이터 📖 논문: Imagination Helps Visual Reasoning, But Not Yet in Latent Space 📅 ID: arXiv:2602.22766 🏷️ 키워드: Multimodal LLM, Visual ...
AI가 작성한 코드, 내 PC에서 그냥 실행하십니까? 알리바바 ‘OpenSandbox’가 완벽한 해답인 이유 최근 LLM(대규모 언어 모델)의 발전으로 AI 에이전트가 단순히 코드를 제안하는 것을 넘어, 직접 시스템에 접근해 코드를 실행하고, 파일을 수정하며, 터미널 명령어를 입력하는 시대가 되었습니다. 하지만 검증되지 않은 AI 생성 코드를 호스트...
📖 논문: arXiv:2602.22010 🖥️ Github/Project: Project Page 📅 발표일: 2026년 2월 ✍️ 저자/기관: WoGNet Research Team 요즘 VLA (Vision-Language-Action) 모델이 로보틱스 판을 다 씹어먹고 있다는 거, 다들 알고 계시죠? RT-2 오픈소스 버전들이 쏟아지면서 로봇에게...
최근 구글의 GameNGen(둠 게임 시뮬레이션)이나 OpenAI의 Sora 같은 비디오 생성 모델들이 핫했죠. 그런데 이 모델들의 공통적인 한계가 뭔지 아시나요? 바로 ‘혼자 노는 AI’라는 겁니다. 현실 세계나 우리가 즐기는 대부분의 게임(MMORPG, FPS)은 다수의 에이전트가 상호작용하는 멀티플레이 환경입니다. 내가 당신을 때리면, 당신의 ...
📖 논문: SkyReels-V4: Multi-modal Video-Audio Generation… 🖥️ 프로젝트: HuggingFace Page “AI로 영상을 만드는 건 좋은데, 배경음악은 따로 생성하고 싱크 맞추느라 밤새셨나요?” 지금까지의 비디오 생성 AI는 ‘영상’만 잘 만들거나, ‘편집’이 안 되거나, ‘오디오’가 엉망인 경우가 태반이...
[Metadata Block] 📖 논문: arXiv:2602.19163 🖥️ Github/Project: JavisVerse 📅 발표일: 2026년 2월 (arXiv 기준) ✍️ 저자/기관: JavisVerse Team [Introduction: The Hook] 요즘 Sora니 Veo3니, 상용 비디오 생성 AI들의 발전 속도가 ...
📖 논문: DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation 🖥️ 프로젝트/Github: 공식 코드 공개 예정 생성형 AI로 완벽한 홍보 영상이나 버추얼 휴먼(Virtual Human) 콘텐츠를 만들려다, 다중 인물의 얼굴이 바뀌거나 목소리가 ...
LLM의 ‘기억력’을 10배 끌어올리는 기술: 4B 모델로 SOTA를 달성한 QRRanker의 마법 📖 논문: Query-focused and Memory-aware Reranker for Long Context Processing 🖥️ 프로젝트: HuggingFace Paper Page LLM의 컨텍스트 윈도우(Context Window)가 ...
최근 AI 개발자들 사이에서 “RAG(검색 증강 생성)의 끝판왕이 등장했다”는 소문이 돌고 있는 프로젝트가 있습니다. 바로 VectifyAI에서 공개한 PageIndex입니다. 우리가 흔히 알고 있는 RAG 시스템은 문서를 잘게 쪼개고(Chunking), 벡터로 변환하여(Embedding), 벡터 데이터베이스(Vector DB)에 저장한 뒤 유사도를...