Blog
-
Use case[현장노트] 시방서 검토 시간 50% 단축, 우리가 실제로 해봤습니다.
B2B 영업의 성패는 고객의 요구를 얼마나 정확하고 빠르게 파악하느냐에 달려 있습니다. 문제는, 그 요구가 단순하지 않다는 점입니다. 특히 승강기 산업처럼 건물 구조와 법규에 따라 수천 가지 사양이 조합되는 주문 제작형 제조업에서는 수십 페이지의 RFQ(견적요청서)와 복잡한 시방서가 영업의 첫 관문이 됩니다. 실제 저희가 만난 글로벌 제조 기업도 같은 고민을 안고 있었습니다. 승강기는 적재 하중, 속도, 제어 […]
-
Tech2026년 AI 에이전트의 핵심, Harness Engineering
최고 시속 350km를 넘나드는 1,000마력의 F1 엔진을 일반 경차 프레임에 얹는다면 어떤 일이 벌어질까요? 아마 시동을 거는 순간, 차체는 그 폭발적인 힘을 감당하지 못하고 붕괴될 가능성이 큽니다. 가속 페달을 밟아보기도 전에 심각한 사고로 이어질 수 있을 것입니다. 아무리 엔진 성능이 압도적이라 해도 이를 뒷받침할 견고한 섀시(Chassis), 정밀한 조향 장치, 신뢰할 수 있는 제동 시스템이 없다면 […]
-
Product시방서 100페이지 스펙 추출 ‘1분 컷’의 비밀
“이것만 다 읽으면 견적 낼 수 있을 텐데…” 수백 페이지짜리 시방서를 한 장 한 장 넘기며 스펙을 찾는 일, 참 고단한 작업입니다. 분명 글자를 읽고 있는데, 정작 필요한 정보는 자꾸 눈을 피해 다니는 기분이 들죠. 여전히 많은 제조 현장에서는 이 ‘시방서 검토’라는 과정에 많은 시간을 쏟고 있습니다. “요즘 똑똑하다는 ChatGPT에 시방서를 넣었는데, 왜 스펙 추출이 […]
-
Tech컨텍스트 엔트로피: AI 에이전트 시대의 숨은 난제
인공지능과 대화를 나누다 보면 어느 순간 미묘한 위화감을 느낄 때가 있습니다. 처음에는 내 의도를 완벽히 파악해 정교한 코드를 짜내던 AI 에이전트가, 대화가 길어지고 프로젝트 규모가 커질수록 점차 초점을 잃고 헤매기 시작하는 지점입니다. 방금 수정했던 함수를 기억하지 못하거나 이미 해결된 버그를 다시 언급하고, 심지어 논리적으로 앞뒤가 맞지 않는 환각(Hallucination) 증세를 보이기도 합니다. 현장에서는 흔히 “AI가 지쳤다”거나 […]
-
Tech터보퀀트(TurboQuant): AI 메모리 병목의 종말
지난주, 전 세계 IT 업계의 시선은 구글 리서치(Google Research)의 발표로 향했습니다. 하드웨어의 물리적 한계에 부딪혔던 AI 모델의 효율을 극적으로 끌어올린 신기술, ‘터보퀀트(TurboQuant)’가 공개되었기 때문입니다. 최근의 대규모 언어 모델(LLM)은 수백 페이지의 문서를 단숨에 읽어내며 마치 ‘무한한 기억력’을 가진 듯한 능력을 보여줍니다. 하지만 이 놀라운 성능 뒤에는 거대한 인프라 장벽인 ‘KV 캐시(Key-Value Cache) 병목 현상’이 자리 잡고 […]
-
Tech지식 증류 기술로 한계를 돌파한 엣지 AI
우리는 지금 ‘거거익선(巨巨益善)’의 AI 시대에 살고 있습니다. 수천억 개의 파라미터를 자랑하는 초거대 언어 모델(LLM)들이 연일 인간의 능력을 뛰어넘는 새로운 기록을 갈아치우고 있죠. 하지만 이 화려한 기술을 현업에 상용화하려는 순간, 우리는 차가운 현실과 마주하게 됩니다. 바로 쾌적한 클라우드 위에서만 돌아가는 무거운 인공지능과 스마트폰, 자율주행 드론, 산업용 비전 카메라 같은 엣지(Edge) 기기의 물리적 한계 사이에 존재하는 거대한 […]
-
Tech잠든 데이터를 깨우는 GraphRAG
챗GPT나 클로드 같은 생성형 AI를 업무나 일상에서 활용하다 보면 가끔 한계에 부딪힐 때가 있습니다. AI가 학습하지 못한 최신 정보를 물었을 때 엉뚱한 대답을 내놓는 ‘환각(Hallucination)’ 현상이 나타나거나, 우리 회사 내부의 복잡한 문서를 제대로 이해하지 못해 겉도는 답변만 반복하곤 하죠. 이러한 문제를 해결하기 위해 등장한 기술이 바로 RAG(Retrieval-Augmented Generation, 검색 증강 생성)입니다. AI에게 무작정 대답하라고 하는 […]
-
Tech왜 Qwen3.5는 Gated DeltaNet를 선택했나?
최근(26년 2월 중순) 발표된 Qwen3.5의 등장은 인공지능 업계에 신선한 충격을 주었습니다. 단순히 성능이 좋아진 것을 넘어, 기존 AI의 고질적인 문제인 ‘효율성’을 해결할 새로운 아키텍처의 가능성을 증명했기 때문입니다. 이 모델이 압도적인 속도와 정확도를 동시에 잡을 수 있었던 비결의 중심에는 바로 ‘Gated DeltaNet(GDN)’라는 혁신적인 기술이 있습니다. AI가 방대한 데이터를 처리하는 과정은 흔히 거대한 도서관에서 정보를 관리하는 사서의 […]
-
TechAI 워크 스테이션 선정 가이드
AI 기술 도입과 연구를 계획하는 이들에게 최근 메모리 및 저장장치의 가격 급등은 적지 않은 충격으로 다가오고 있습니다. 더욱이 고성능 GPU의 수급난까지 겹치며 AI 하드웨어 인프라 구축의 문턱은 나날이 높아지는 있죠. 이러한 ‘하드웨어 보릿고개’ 속에서, 과연 우리는 어떠한 전략적 선택을 통해 비용 대비 효율을 극대화해야 할까요? 단순히 “가장 비싼 GPU”를 구매하는 것이 정답이던 시대는 지난 것 […]