AI News Archive: May 29, 2026 — Part 5
Sourced from 500+ daily AI sources, scored by relevance.
- TCS and Mistral agree partnership for advanced AI model deployment
TCS and Mistral agree partnership for advanced AI model deployment verdict.co.uk
- India unveils AI-driven roadmap to modernise fisheries governance
The initiative aims to curb illegal fishing, improve fisher safety and build transparent seafood supply chains, while expanding digital vessel tracking systems across India’s coastal regions
- How smartphones and AI are reshaping our bodies and minds
A new look at how everything from handwriting to AI quietly reshapes our bodies, habits and sense of connection
Score: 41🌐 MovesMay 29, 2026https://www.scientificamerican.com/podcast/episode/how-smartphones-and-ai-are-reshaping-our-bodies-and-minds/ - Amazon Is Making an AI-Animated ‘Good Advice Cupcake’ TV Show. Its Original Creator Is Furious
Loryn Brantz created The Good Advice Cupcake for BuzzFeed years ago. The company licensed the character for a new Amazon series—made with AI—without her consent.
- These S&P 500 stocks soared the most during the AI-driven May rally
Even stocks in the beleaguered software industry have been on fire.
- Round Rock-based Dell rides AI boom, Pentagon contract to huge stock surge
Round Rock-based Dell rides AI boom, Pentagon contract to huge stock surge Austin American-Statesman
Score: 40🌐 MovesMay 29, 2026https://www.statesman.com/business/technology/article/dell-stock-ai-revenue-record-trump-22282097.php - As government scales AI, data strategy will define success
The major challenge facing federal agencies is data readiness, rather than model access. The post As government scales AI, data strategy will define success appeared first on FedScoop .
- Data And Storage At The Center Of The AI Stack
Data And Storage At The Center Of The AI Stack
Score: 40🌐 MovesMay 29, 2026https://www.nextplatform.com/store/2026/05/29/data-and-storage-at-the-center-of-the-ai-stack/5247585 - The Race To Power AI: How SEI Is Betting On Speed-To-Power
SEI stock is on the rise amid massive demand from data centers and artificial intelligence companies. The post The Race To Power AI: How SEI Is Betting On Speed-To-Power appeared first on Investor's Business Daily .
Score: 40🌐 MovesMay 29, 2026https://www.investors.com/research/the-new-america/sei-stock-solaris-energy-data-centers-ai/ - Oil eyes weekly drop on Hormuz deal hopes; AI sends stocks to record highs
World stocks stood at record highs on Friday and oil futures eyed the steepest weekly drop for nearly two months as traders waited for details on a potential deal to reopen the Strait of Hormuz and extend the US-Iran ceasefire.
- Rising Costs Are Limiting Ai Use
Rising Costs Are Limiting Ai Use Computing UK
Score: 40🌐 MovesMay 29, 2026https://www.computing.co.uk/tag/undefined/news/2026/ai/rising-costs-are-limiting-ai-use - Sigenergy Unveils SigenAgent, the First All-Domain AI Agent for the Renewable Energy Industry
Sigenergy Unveils SigenAgent, the First All-Domain AI Agent for the Renewable Energy Industry Toronto Star
- Japan firms embrace liquid cooling for AI data centers to save power
Japan firms embrace liquid cooling for AI data centers to save power Nikkei Asia
- 기업 AI 추진이 막히는 이유, 그리고 CIO의 돌파구
지난 1년 동안 AI 프로젝트를 추진했지만 기대에 미치지 못하거나 완전히 실패한 CIO는 결코 드물지 않다. AI 프로젝트 투자는 급증하고 있지만, 가트너 조사에 따르면 기업의 거의 절반은 여전히 실질적인 비즈니스 가치를 입증하는 데 어려움을 겪고 있다. 리전스은행 최고데이터·애널리틱스책임자(CDAO) 매너브 미스라는 “사람들이 비현실적인 기대를 갖고 뛰어들었고, 가장 큰 실망도 바로 거기서 비롯됐다”라고 말했다. 그는 다수의 현업 전문가들과 마찬가지로 “문제는 기술 자체가 아니라 이를 둘러싼 요소들”이라고 지적했다. 실제로 조직적·운영적·구조적 실패가 프로젝트 전 과정에서 발목을 잡고 있다는 설명이다. CIO 조직은 모델 선택이나 플랫폼 아키텍처, 데이터 파이프라인 측면에서는 명확한 전략을 갖추고 있을 수 있다. 하지만 실제로는 잘못된 프로젝트를 선택하거나, 비즈니스 성과와 성공 지표를 충분히 구체적으로 정의하지 못하거나, 현업 리더와의 협업이 부족하거나, 사용자들을 초기 단계부터 참여시키지 못하는 경우가 많다. width="1240" height="827" sizes="auto, (max-width: 1240px) 100vw, 1240px"> Manav Misra, Regions Bank Regions Bank AI 프로젝트는 사용자들의 불안과 의구심에도 직면한다. 금융 기술 기업 잭헨리(Jack Henry)의 최고데이터책임자(CDO) 키스 풀턴(Keith Fulton)은 “과거에는 해외 인력 대체자를 교육하라는 요구를 받았고, 이제는 우리를 대체할 AI를 훈련시키는 상황이 됐다”라고 말했다. 하지만 적어도 현재 시점에서 LLM은 생산성을 높일 수는 있어도 여전히 인간의 검토와 검증이 필요하다. 풀턴은 “AI는 뛰어난 인턴 같지만 반드시 가이드가 필요하다”라고 설명했다. 콜로니얼 파이프라인 전 최고기술·데이터책임자였던 아프신 탈라사즈는 “과거의 플레이북은 더 이상 효과적이지 않다”라며 “세부 사항까지 깊이 파고들고, 무엇을 하려는지 명확히 정의하며, 기대치를 분명히 해야 한다”라고 말했다. 이 같은 기본적인 실수가 다음 AI 프로젝트의 치명적인 약점이 되어서는 안 된다는 지적이다. AI 프로젝트는 CIO 혼자 이끌 수 없다 FTI컨설팅 AI·디지털전환 부문 총괄인 수밋 굽타(Sumeet Gupta) 수석매니징디렉터는 CIO 혼자 AI 센터오브엑설런스(CoE)를 운영하도록 하는 것은 거의 성공 공식이 아니라고 지적했다. 그는 “CIO는 종종 플랫폼 중심 시각으로 프로젝트를 추진하게 되는데, 실제 문제는 거기에 있지 않다”라며 “AI 프로젝트는 기술 프로젝트가 아니라 AI를 활용해 원하는 비즈니스 성과를 달성하는 사업 프로젝트”라고 설명했다. 이어 “반드시 적절한 현업 책임자와 공동으로 프로젝트를 이끌어야 하며, 근본적인 비즈니스 문제는 바로 그 과정에서 해결된다”라고 덧붙였다. width="1240" height="827" sizes="auto, (max-width: 1240px) 100vw, 1240px"> Sumeet Gupta, FTI Consulting FTI 풀턴 역시 AI 프로젝트는 비즈니스 조직이 주도해야 한다고 강조했다. 그는 “현업 리더가 먼저 기회를 발굴하고, 이후 AI 전문가들이 그 가능성을 검토해 우선순위를 정해야 한다”라며 “이 과정에서 컨설턴트에 지나치게 의존해서는 안 된다”라고 말했다. 이어 “조직 내부에서 신중한 시각을 유지해줄 파트너가 필요하다”라고 덧붙였다. 풀턴은 이 같은 교훈을 일찍 경험했다고 설명했다. 그는 “유일하게 실패한 실험은 1년 전 진행한 컨설팅 프로젝트였다”라며 “재무 부문에서 AI 활용 사례를 찾기 위해 진행됐지만 결국 당시 기술 수준으로는 유의미한 사례를 발굴하지 못했다”라고 말했다. 반면 리전스은행의 미스라는 비즈니스 출신 제품 관리자(Product Manager)를 포함한 팀을 운영하고 있다. 이들은 현업 요구를 명확히 이해하고 있으며, 사업 부문 리더와 함께 실질적인 기회를 발굴한다. 미스라는 “가치를 실현하기 위해 적극적으로 투자할 의지가 있는 임원 스폰서가 필요하다”라며 “비즈니스 책임자 역시 성공이 실제로 어떤 모습인지 명확히 정의하고 있어야 한다”라고 말했다. 성공 지표는 현업이 정해야 한다 CIO는 프로젝트 초기 단계부터 현업 리더와 함께 어떤 지표가 원하는 비즈니스 성과를 의미하는지 합의해야 한다. 또한 비즈니스와 IT 조직은 해당 지표를 분기별로 함께 점검해야 한다. FTI컨설팅의 수밋 굽타는 “해당 사업의 손익(P&L)을 책임지는 사람이 성과 측정의 책임도 져야 하며, 어떤 지표를 사용할지도 직접 결정해야 한다”라고 말했다. 그는 “측정 방식에 대해서는 CIO가 의견을 제시할 수 있지만, 손익에 연결되는 실제 비즈니스 KPI는 반드시 사업 책임자가 정해야 한다”라고 설명했다. 다만 프로젝트 성공을 위해서는 단순한 경영진의 지지만으로는 충분하지 않다. 사용자 참여 없이는 AI 도입도 어렵다 아무리 잘 설계된 IT 프로젝트라도 직원들이 실제로 사용하지 않으면 의미가 없다. 특히 AI 프로젝트에서는 이런 문제가 더욱 두드러진다. 굽타는 한 기업 사례를 언급하며 “AI 모델용 래퍼(wrapper)를 개발하는 데 투자했지만 결국 차별화된 비즈니스 가치를 만들지 못했다”라고 말했다. 그는 “AI CoE 팀은 흥미로운 프로젝트라고 생각했지만, 더 넓은 사용자 조직을 논의 과정에 참여시키지 않았다”라고 설명했다. 풀턴은 AI에 대한 두려움과 냉소주의도 여전히 크다고 지적했다. 그는 “사람들이 AI를 대체자가 아니라 업무를 돕는 도구로 인식하도록 만드는 조직 변화관리(change management)가 매우 큰 과제”라며 “AI가 추천 결과를 만들 수는 있지만, 고객에게 전달하기 전 인간의 검토는 필수적인 검증 단계”라고 말했다. 이 때문에 사용자들은 프로젝트 초기부터 모든 단계에 참여해야 한다는 설명이다. 굽타는 “기술팀이 복잡한 AI 제품을 만들었지만 현업 사용자들이 프로세스 자체에 참여하지 않았기 때문에 실제로는 사용되지 않은 사례를 수없이 봤다”라며 “특히 기술 기반 혁신 프로젝트에서는 절대 성공할 수 없는 방식”이라고 말했다. 리전스은행의 미스라도 초기 공감대를 충분히 확보하지 못해 프로젝트 배포가 지연된 사례를 언급했다. 그는 “누군가 ‘이게 제대로 작동할지 모르겠다’라고 말하기 시작하면 의심이 확산되는 악순환이 시작된다”라고 설명했다. 그는 초기 지지자를 발굴·지원하고, 동료들을 위한 워크숍을 운영하며, 분기별 사용률과 도입률을 점검하는 단계적 배포 전략을 권고했다. 사용자를 초기 단계부터 참여시키는 또 다른 장점은 변화가 점진적으로 진행되기 때문에 조직이 느끼는 부담이 줄어든다는 점이다. 잭헨리는 특히 사용자 코칭에 큰 비중을 두고 있다. 풀턴은 “10명 규모의 전담팀이 사용자들의 AI 도구 활용을 지원하고 있다”라며 “올바르게 안내하면 충분히 사용자들을 설득할 수 있지만, 적합하지 않은 경우 억지로 강요하지는 않는다”라고 말했다. width="1240" height="698" sizes="auto, (max-width: 1240px) 100vw, 1240px"> Keith Fulton, chief data officer, Jack Henry Jack Henry 굽타는 결국 사용자들을 변화 과정에 참여시키고 책임감을 부여해야 한다고 강조했다. 그는 “AI가 워크플로우에 어떤 영향을 미칠지, 필요한 변화는 어떻게 해결할지에 대한 논의 과정에 사용자들을 반드시 포함시켜야 한다”라고 말했다. 워크플로우와 변화관리 영향까지 함께 검토해야 AI를 활용한 자동화를 추진하기 전에 CIO와 주요 이해관계자들은 현재와 미래의 워크플로우를 함께 검토해야 한다. 특히 생산성과 직원들의 업무 방식에 어떤 영향을 미칠지까지 고려해야 한다. FTI컨설팅의 수밋 굽타는 “워크플로우 재설계와 변화관리(change management)는 항상 함께 가야 한다”라고 말했다. 그는 “실제로 한 기업에서는 AI 제품을 도입했지만 변화관리를 제대로 하지 않아 오랫동안 활용되지 못한 사례가 있었다”라고 설명했다. 해당 기업은 핵심 업무 영역에서 대규모 수작업을 줄이고 프로세스 정확도를 높이기 위해 비교적 복잡한 에이전틱 AI 워크플로우를 설계했다. 하지만 이를 제대로 정착시키기 위해서는 인력 운영모델과 조직 변화관리 문제를 함께 해결해야 했다. 굽타는 “이 작업이 적절한 시점에 이뤄지지 않았다”라며 “AI 워크플로우 자체는 매우 잘 설계되고 개발됐지만 실제 현업에서는 수개월 동안 제대로 활용되지 못했다”라고 말했다. 그는 모든 프로젝트에 이른바 ‘퍼스트 프린서플(first principles)’ 접근 방식을 적용한다고 설명했다. 우선 워크플로우를 통해 해결하려는 문제가 무엇인지, 원하는 결과는 무엇인지, 필요한 입력 데이터는 무엇인지를 정의한 뒤 AI 환경에서 미래 프로세스가 어떻게 작동할지 다시 설계해야 한다는 의미다. 그는 “이런 제약 조건을 기반으로 설계해야 한다”라며 “AI 시대에 가장 큰 문제는 기존 방식을 재창조하거나 재구상하려는 노력이 부족하다는 점”이라고 지적했다. 이를 위해서는 현업 리더와 사용자 모두의 참여가 필요하다는 설명이다. 반면 잭헨리의 키스 풀턴은 처음부터 모든 프로세스를 전면 재설계하는 방식에는 다소 신중한 입장을 보였다. 그는 “업무 프로세스 혁신(BPR)은 지난 20년 동안 계속 논의돼 왔지만 기대만큼 성과를 내지는 못했다”라며 “비용이 많이 들고 대기업에는 수백, 수천 개의 프로세스가 존재하기 때문”이라고 설명했다. 현재 에이전틱 AI는 복잡한 프로세스보다는 비교적 단순한 업무 프로세스에서 더 효과적으로 작동하고 있다는 분석이다. 다만 AI 에이전트는 점차 비즈니스 프로세스를 이해하고 최적화하는 방향으로 발전하고 있다. 풀턴은 “과거에는 RPA 도구로 워크플로우 다이어그램을 직접 설계해야 했지만, 이제는 LLM에 필요한 절차를 설명하면 스스로 워크플로우를 구성하기 시작한다”라고 말했다. width="1240" height="828" sizes="auto, (max-width: 1240px) 100vw, 1240px"> Avivah Litan, VP and distinguished analyst, Gartner Gartner 그러나 인간의 세밀한 설정 없이 복잡한 다단계 엔터프라이즈 워크플로우를 자율적으로 최적화할 수 있는 AI 에이전트는 아직 초기 단계에 머물러 있으며, 대규모 환경에서 충분히 검증되지 않았다고 그는 덧붙였다. 한편 아무리 의도가 좋은 워크플로우 설계와 조직 변화관리 계획이라도 데이터 요구사항에 대한 정확한 이해가 없다면 제대로 작동하기 어렵다는 지적도 나온다. 데이터 준비 부담이 프로젝트를 마비시킨다 AI 프로젝트를 시작하기 전에 모든 데이터를 완벽하게 준비해야 한다는 통념은 오히려 프로젝트 추진 자체를 가로막을 수 있다. FTI컨설팅의 수밋 굽타는 “많은 기업이 데이터가 완벽하지 않으면 AI가 제대로 작동하지 않을 것이라고 생각한다”라고 말했다. 하지만 모든 프로젝트가 정제된 고품질 데이터를 요구하는 것은 아니라는 설명이다. 그는 “기업들은 실제 사용 사례와는 무관한 데이터 문제에 지나치게 집착하다 프로젝트를 지연시키는 경우가 많다”라고 지적했다. 잭헨리의 키스 풀턴 역시 “데이터는 머신러닝 모델에는 매우 중요한 요소지만 대부분의 거대언어모델(LLM) 프로젝트에서는 상대적으로 덜 중요하다”라고 말했다. 다만 복잡한 예측 모델이나 고객 단위 개인화, 영업 리드 스코어링 같은 프로젝트에서는 데이터 중요성이 커진다고 설명했다. 이와 관련해 리전스은행의 매너브 미스라는 “그런 경우에는 프로젝트에 실제로 필요한 핵심 데이터가 무엇인지 먼저 식별한 뒤 그 부분에만 집중해야 한다”라고 조언했다. 그는 “AI 기반 데이터 정제·통합·준비 도구를 활용하면 데이터 문제를 훨씬 쉽게 해결할 수 있다”라고 덧붙였다. 반면 가트너의 아비바 라이탄(Avivah Litan) VP 겸 수석 애널리스트는 실제로 우려해야 할 데이터 문제도 적지 않다고 지적했다. 그는 데이터 품질 문제와 메타데이터·데이터 계보(lineage) 정보 부족이 규제 준수와 설명 가능성, 규제기관 보고를 어렵게 만들 수 있다고 설명했다. 또한 데이터 사일로와 미성숙한 메타데이터 관리 체계 역시 규제 대응 준비를 가로막는 주요 요인이라고 덧붙였다. 데이터 준비 부담이 프로젝트를 마비시킨다 AI 프로젝트를 시작하기 전에 모든 데이터를 완벽하게 준비해야 한다는 통념은 오히려 프로젝트 자체를 가로막는 요인이 될 수 있다. FTI컨설팅의 수밋 굽타는 “많은 기업이 데이터가 충분하지 않으면 AI가 제대로 작동하지 않을 것이라고 생각한다”라고 말했다. 하지만 모든 프로젝트가 완벽하게 정제된 데이터를 필요로 하는 것은 아니라는 설명이다. 그는 “기업들이 실제 사용 사례와는 무관한 데이터 문제에 지나치게 집착하다 프로젝트 추진 자체가 멈춰버리는 경우가 많다”라고 지적했다. 잭헨리의 키스 풀턴 역시 “데이터는 머신러닝 모델에서는 매우 중요한 요소지만 대부분의 거대언어모델(LLM) 프로젝트에서는 상대적으로 덜 중요하다”라고 말했다. 다만 복잡한 예측 모델이나 고객 단위 개인화, 영업 리드 스코어링 같은 프로젝트에서는 데이터 중요성이 커진다고 설명했다. 리전스은행의 매너브 미스라는 “그런 경우에는 프로젝트에 실제로 필요한 핵심 데이터가 무엇인지 먼저 식별한 뒤 그 부분에만 집중해야 한다”라고 조언했다. 그는 “AI 기반 데이터 정제·통합·준비 도구를 활용하면 데이터 문제를 훨씬 쉽게 해결할 수 있다”라고 덧붙였다. 반면 가트너의 아비바 라이탄(Avivah Litan) VP 겸 수석 애널리스트는 실제로 우려해야 할 데이터 문제 역시 적지 않다고 지적했다. 그는 데이터 품질 문제와 메타데이터·데이터 계보(lineage) 정보 부족이 규제 준수와 설명 가능성, 규제기관 보고를 어렵게 만들 수 있다고 설명했다. 또한 데이터 사일로와 미성숙한 메타데이터 관리 체계 역시 규제 대응 준비를 가로막는 주요 요인이라고 덧붙였다. AI는 똑똑하지만 항상 신뢰할 수 있는 것은 아니다 아프신 탈라사즈는 AI 오케스트레이션과 관측 가능성(observability) 측면에서 거버넌스가 매우 중요하다고 강조했다. 그는 “AI 에이전트는 의도하지 않은 행동을 할 수 있으며, 이를 추적하고 가시화할 수 있어야 한다”라고 말했다. 잭헨리의 키스 풀턴은 기업들이 LLM에 지나치게 많은 역할을 기대하고 검증 절차 없이 신뢰하는 것이 대형 실패의 근본 원인이라고 지적했다. 그는 “LLM은 예상치 못한 실수를 하기도 하고, 어리석은 오류를 범하기도 하며, 특정 산업이나 업무 영역에 대한 맥락 이해도 부족하다”라고 설명했다. 이어 “출력 결과를 평가할 때 단순한 ‘똑똑함’을 실제 경험과 맥락 이해로 착각해서는 안 된다”라며 “모든 AI 결과물은 실제 운영 환경에 적용하기 전에 반드시 인간의 검토를 거쳐야 한다”라고 강조했다. 보다 복잡한 작업에서는 LLM이 처리 가능한 토큰 윈도우를 넘어서는 맥락을 요구받을 경우 방향을 잃는 문제도 발생할 수 있다. 풀턴은 “그 시점이 되면 정보를 억지로 압축하게 되고, 결국 LLM이 흐름을 잃으면서 환각(hallucination)을 일으키기 시작한다”라고 설명했다. 그는 “LLM은 다양한 작업을 수행할 수 있지만, 작업 규모가 커질수록 오히려 맥락을 놓치기 쉽다”라며 “실제 운영 경험상 장시간 자율적으로 실행되는 프로세스보다 짧고 범위가 제한된 작업이 훨씬 더 안정적인 결과를 제공한다”라고 말했다. 이에 따라 잭헨리는 AI 활용 전략 역시 짧고 제한적인 업무 중심으로 설계하고 있다고 덧붙였다. 예상치 못한 실패는 승인되지 않은 비공식 프로젝트, 이른바 ‘섀도우 AI(shadow AI)’에서도 발생할 수 있다. 탈라사즈는 “섀도우 AI의 가장 큰 문제는 누군가 거버넌스 없이 핵심 업무 프로세스용 AI를 구축하는 것”이라며 “문제가 발생하거나 시스템이 깨졌을 때 이를 추적하거나 관찰할 수 없기 때문에 조직 전체의 지속 가능성과 리스크 관리에 큰 부담이 된다”라고 말했다. width="1240" height="698" sizes="auto, (max-width: 1240px) 100vw, 1240px"> Afshean Talasaz, former chief technology and data officer, Colonial Pipeline CIO.com 한편 가트너 조사에 따르면 기업의 69%는 직원들이 금지된 AI 도구를 사용하고 있다고 의심하거나 실제 증거를 확보한 상태다. 잭헨리는 이를 최소화하기 위해 의무 교육과 승인 절차 기반의 강력한 데이터 거버넌스를 운영하고 있다. 회사는 공개 챗봇과 같은 승인되지 않은 도구 사용을 엄격히 금지하고 있으며, 직원들이 외부 서비스를 찾지 않도록 100개 이상의 AI 기반 애플리케이션을 내부에 제공하고 있다고 설명했다. 너무 많은 PoC가 중도에 사라진다 아프신 탈라사즈는 파일럿 프로젝트가 실패하는 주요 원인 중 하나로 프로젝트 수행 조직과 기대를 가진 조직 간의 인식 차이를 꼽았다. 그는 “파일럿이 무엇을 목표로 하는지 명확해야 한다”라며 “단순 실험 목적의 프로젝트인지, 아니면 실제 성과 달성 가능성이 높은 프로젝트인지부터 분명히 구분해야 한다”라고 말했다. 일부 파일럿 프로젝트는 비즈니스 효과에 대한 충분한 이해 없이 추진되기도 한다. FTI컨설팅의 수밋 굽타는 한 기업이 프로젝트의 재무적 가치를 제대로 분석하지 않은 채 AI 프로젝트를 시작한 사례를 소개했다. 그는 “AI 활용 사례를 정의한 이후 실제 투자를 집행하기 전에는 반드시 경제성 분석을 거쳐야 한다”라며 “이 단계는 프로젝트를 계속 진행할지 중단할지를 결정하는 핵심 판단 지점”이라고 설명했다. 이어 “우리가 재무 분석을 진행해보니 해당 AI 프로젝트의 초기 투자비와 지속 운영비가 예상 절감 효과의 중간값보다 더 큰 것으로 나타났다”라고 말했다. 일부 프로젝트는 성능 기준 자체를 충족하지 못하기도 한다. 파일럿 단계에서는 90% 수준의 정확도를 달성할 수 있지만, 이를 99% 수준까지 끌어올리기 위해서는 6개월 이상의 데이터 정제와 튜닝 작업이 필요한 경우가 많다. 하지만 잭헨리 같은 금융 서비스 기업은 사실상 100% 수준의 정확성을 요구한다. 키스 풀턴은 “99%만 정확한 업무 자동화 도구는 실제로는 가치가 없다”라며 “단 한 번의 오류만으로도 현업 리더의 신뢰를 잃게 되고, 결국 파일럿 프로젝트 자체가 중단될 수 있다”라고 말했다. PoC(개념검증)를 실제 운영 규모로 확장하는 과정에서 문제가 드러나는 경우도 흔하다. 탈라사즈는 “엔지니어들이 만든 PoC가 소규모 환경에서는 잘 작동하더라도 실제 대규모 환경에서는 지나치게 비용이 많이 들거나 구조적으로 확장이 불가능한 경우가 적지 않다”라고 설명했다. 그는 “PoC 자체는 만들 수 있지만 이를 운영 규모로 확장할 설계 역량이나 엔지니어링 인력, 인프라가 부족한 상황도 많다”라고 덧붙였다. 시간 역시 또 다른 위험 요소다. 파일럿 프로젝트가 종료되면 초기 개발팀이 원래 업무로 복귀하고, 이후 새로운 팀이 프로젝트를 이어받는 경우가 많다. 이 과정에서 핵심 지식이 단절되며 프로젝트 속도가 크게 느려질 수 있다. 탈라사즈는 “개인적으로는 동일한 팀이 PoC부터 실제 운영 단계까지 계속 담당하는 방식을 선호한다”라고 말했다. 굽타는 이를 위해 명확한 생존 지표(proof-of-life milestone)와 에이전틱 워크플로우 사용자 시뮬레이션, 그리고 단계별 정확도 기준이 필요하다고 조언했다. 그는 “적절한 인력과 명확한 마일스톤이 없다면 결국 파일럿 프로젝트는 중도에 멈춰서게 된다”라고 말했다. 운영 단계에 들어가도 지속 가능성은 또 다른 과제 파일럿 프로젝트가 실제 운영 환경에 적용됐고 현재는 정상적으로 작동한다고 해도 문제는 그 이후다. 과연 이 상태를 지속적으로 유지할 수 있을까. 아프신 탈라사즈는 “많은 조직이 아직 프로젝트를 운영 단계까지 올리는 데 집중하느라 지속 가능성까지 충분히 고민하지 못하고 있다”라며 “하지만 결국 반드시 고려해야 하는 문제”라고 말했다. 모델 드리프트(model drift) 같은 운영 이슈를 지속적으로 모니터링하는 것도 중요하지만, 벤더 종속(vendor lock-in) 위험과 증가하는 기술 부채(technical debt) 역시 장기적으로 큰 부담이 될 수 있다. 이런 문제를 설계 단계나 파일럿 단계에서 충분히 고려하지 않으면 실제 운영에 들어간 뒤에는 구조적인 문제로 굳어질 수 있다는 설명이다. 가트너는 데이터와 모델, 워크플로우가 특정 벤더의 API나 데이터 레이크, 플랫폼 도구에 지나치게 종속되는 상황을 경계해야 한다고 조언했다. 대신 개방형 표준(open standard)을 따르고, AI 스택 설계 시 오픈 API와 모듈형 아키텍처를 적용해야 한다는 설명이다. 기술 부채와 관련해서도 가트너는 향후 4년 안에 기업의 절반이 관리되지 않은 생성형 AI 기술 부채로 인해 AI 업그레이드 지연과 유지보수 비용 증가를 경험할 것으로 전망했다. 이에 따라 기업들은 AI 레지스트리(registry)를 유지하고, 모델 카드(model card)를 의무화하며, 드리프트 모니터링 체계를 구축해야 한다고 권고했다. 또한 벤더에게 모델 변경 사항을 사전에 공지하도록 요구할 필요도 있다고 덧붙였다. 결국 다른 IT 프로젝트와 마찬가지로 AI 프로젝트에도 동일한 수준의 IT 라이프사이클 관리 원칙을 적용해야 한다는 의미다. 악마는 디테일에 있다 탈라사즈는 AI 프로젝트에서 해결해야 할 과제가 많지만, 결국 성공 여부는 세부 실행력에 달려 있다고 강조했다. 그는 “데이터와 거버넌스 같은 기술적 요소뿐 아니라 실제 비즈니스 업무가 어떻게 돌아가는지까지 세밀하게 이해해야 한다”라고 말했다. 이어 “업무의 세부적인 흐름까지 깊이 파고들어야 하며, 원하는 비즈니스 성과에서 아래로 내려가고 기술 기반에서는 위로 올라오는 방식으로 접근해야 한다”라고 설명했다. 만약 현재 기술 수준이 문제라면 아이디어 자체를 포기할 필요는 없다는 조언도 나왔다. 잭헨리의 키스 풀턴은 “지난해 여러 개발자용 코드 지원 도구를 테스트했지만 우리 규모의 시스템에서는 제대로 작동하지 않았다”라고 말했다. 하지만 8개월 뒤 같은 도구를 다시 테스트한 결과 상황은 완전히 달라졌다. 그는 “지금은 도입 속도가 폭발적으로 확산되고 있다”라고 설명했다. 이어 “어떤 기술은 ‘절대 불가능한 것’이 아니라 단지 ‘아직 시기가 오지 않았을 뿐’인 경우가 많다”라고 덧붙였다. dl-ciokorea@foundryco.com
- Why orchestration, not the model, determines whether your AI scales
I spent most of 2024 convinced I knew where the hard work was. I was building Flow Orchestra, an AI-powered content workflow platform. Solo. All of it: the retrieval components, the generation agents, the scheduling layer, the autonomous content pipelines. From where I was sitting, the engineering challenge was obvious. Get the language models to do what I needed them to do. Prompt architecture. Model selection. That’s where the complexity lived, or so I thought. I was completely wrong. The models worked fine. They were, in fact, the easy part. The orchestration layer nearly broke me. Getting every agent in the system to correctly receive, interpret and pass context to the next one in the chain consumed weeks I hadn’t planned for, forced me to rethink the core architecture and taught me more about how multi-agent AI systems actually fail than anything else in thirty years of working with technology. Context passing between agents. That was the problem. It sounds like a plumbing detail. It isn’t. It’s the difference between a system that works at scale and one that produces excellent demos that fall apart in production. I’m sharing this because most organizations building AI systems right now are making the exact same mistake, with larger teams and significantly more money at stake. The wrong question is still winning Walk into any enterprise AI planning meeting and the conversation centers on models. Which LLM? Proprietary or open source? Fine-tuned or base? These are legitimate questions. They aren’t the questions that determine whether your AI system works across a business function at production scale. Deloitte’s 2026 State of AI in the Enterprise report , drawn from a survey of 3,235 senior leaders across 24 countries, found that only 20 percent of organizations are seeing actual revenue impact from their AI investments, while 74 percent say revenue growth is still an aspiration. One widely cited analysis of enterprise deployments puts the pilot-to-production success rate at just 12 percent. The models in those failed projects weren’t the problem. They were often excellent. The problem was everything around them: the coordination infrastructure, the workflow design, the architecture connecting agent to agent. The model isn’t your competitive advantage. The orchestration layer is. Most organizations are still optimizing the wrong thing. You can’t orchestrate a broken workflow Here’s a pattern I’ve watched play out many times. An organization has a workflow that runs inefficiently: slow approvals, documents lost between systems and handoffs between teams that produce duplication and errors. Then they decide to layer AI on top of it. They build a retrieval agent, add a generation component and wire in automation. The demo looks exactly like the slide deck promised. Then they push to production. And it fails in new, faster, more expensive ways. Here’s what happened: the AI faithfully automated a broken process. It now does at machine speed what humans were doing badly at human speed. Context passed between stages arrives incomplete. Tasks route to the wrong places. Errors that previously took a week to compound now compound in minutes. The AI didn’t create these problems. It amplified the ones already there. You can’t bolt coordination infrastructure onto a process that doesn’t make sense. The workflow has to be redesigned first. That sequencing is non-negotiable and most organizations skip it. When I rebuilt the orchestration layer at Flow Orchestra, I got clear on what the non-negotiables actually were. There were three. The first is a defined context contract between agents. Every agent in the system has to know exactly what it receives from the previous step, what it’s expected to produce and what format information travels in across the pipeline. This isn’t a prompt engineering decision. It’s an architectural decision, and it has to happen before anything else gets built. Without it, you’re hoping each agent correctly interprets what the last one meant. At small scale, that hope sometimes holds. At production scale, it doesn’t. The second is a routing layer that isn’t just another language model. Most teams build an orchestrator agent to coordinate the others, and that orchestrator is itself a large language model making routing decisions with all the probabilistic variability that comes along with it. For business-critical workflows, that’s a liability. Routing logic needs to be deterministic where determinism matters: rules, classifiers, workflow engines. The model handles the language. The routing layer handles the logic. These shouldn’t be the same component. I’ve seen production systems fail at scale precisely because the orchestrator was brilliant at understanding language and inconsistent at routing reliably under volume. The third is a memory layer that survives agent transitions. Context that crosses three agents in a pipeline has to make it through each hop intact. That means external state stored outside the agents themselves: session stores, structured databases that every agent in the chain reads from and writes to consistently. If your agents only have access to what’s in their immediate context window, your system forgets at exactly the wrong moments. And it won’t tell you it’s forgotten. It will produce subtly wrong outputs until something obviously breaks downstream. These aren’t glamorous components. Nobody gives conference talks about context contracts. But they’re what the working systems have that the failed ones didn’t. Start by drawing the context flow Before your team builds another agent or evaluates another model: map your context flow. Not the task flow or the feature list, but the context flow. Draw every agent in your system. Draw what information enters each one. Draw what it produces and what it passes forward. Draw what happens to shared understanding at each transition. Draw what happens when one step fails. The diagram doesn’t need to be pretty. It needs to be honest. Where does one agent hand off to the next? What breaks if that handoff fails? What happens then? Does the system recover or just quietly produce garbage? Those three questions will tell you more about your architecture than any technical review. If you can answer them on paper, you’re ready to build. If you can’t, you’re not. If you’ve already built and still can’t answer them, you’ve found your problem. Every CIO I talk to who’s frustrated with their AI deployment has the same presenting symptom: their agents work in isolation and fail in combination. The fix is never a better model. It’s always the same: go back to the context flow and design it like the infrastructure it actually is. In two years, nobody’s going to remember which model they picked in 2025. They’re going to remember whether their systems actually worked. Build the air traffic control system. Start by drawing the context flow. This article is published as part of the Foundry Expert Contributor Network. Want to join?
Score: 40🌐 MovesMay 29, 2026https://www.cio.com/article/4177689/why-orchestration-not-the-model-determines-whether-your-ai-scales.html - DNS-AID will make AI agents easier to discover, says Linux Foundation
DNS-AID will make AI agents easier to discover, says Linux Foundation InfoWorld
- We Asked the ‘Future of Truth’ Author to Explain How He Used AI. It Didn’t Go Well
A book about how AI shapes perceptions of reality came under fire for using AI-generated quotes. Its problems go beyond that.
- How often does Gemini 3.5 Flash hallucinate or lie? Google isnt saying.
Unlike Anthropic and OpenAI, Google won't say how often Gemini 3.5 hallucinates, lies, or behaves sycophantically. That's a big problem.
Score: 40🌐 MovesMay 29, 2026https://mashable.com/tech/google-gemini-3-5-flash-honesty-accuracy-hallucination-lack-of-transparency - Weely Must-Read: China’s Tech Sector Catches AI Funding Fever
Weely Must-Read: China’s Tech Sector Catches AI Funding Fever Caixin Global
- AI is already rewiring the aftermarket and services
For industrial companies, applying AI to the aftermarket and services could provide a source for differentiation on top of cost and time savings and enhanced customer experiences.
- Opinion | How America can remain the world’s AI superpower
Opinion | How America can remain the world’s AI superpower The Washington Post
- Okta writes its own license to kill rogue AI agents
CEO Todd McKinnon says customers including ServiceNow want an off switch
Score: 40🌐 MovesMay 29, 2026https://www.theregister.com/ai-ml/2026/05/29/okta-writes-its-own-license-to-kill-rogue-ai-agents/5248766 - Fortunes Of Anthropic’s Seven Cofounders More Than Double To $16.6 Billion Each
After a massive fundraise that values the AI company at nearly a trillion dollars, Dario and Daniela Amodei, along with their five cofounders, have seen their net worths soar.
Score: 40💰 MoneyMay 29, 2026https://www.forbes.com/sites/richardnieva/2026/05/29/anthropics-cofounders-worth/ - Model Cards for AI Model Transparency
At Salesforce, we take seriously our mission to create and deliver AI technology that is responsible, accountable, transparent, empowering, and inclusive. These principles ensure that our AI is safe, ethical, and engenders trust.
- I Tried Acer’s New Aspire 18 AI, and, Yes, 18-Inch Laptops for Ordinary Folks Are Now a Thing
I Tried Acer’s New Aspire 18 AI, and, Yes, 18-Inch Laptops for Ordinary Folks Are Now a Thing PCMag
- Developmental Cognitive Interpretability: A Research Agenda for Modelling Generalisation and Predicting Agent Behaviour
Summary Safe deployment of an AI system requires that we can make confident claims about its behaviour on out-of-distribution deployment inputs on the basis of only pre-deployment evaluations. One approach to making such claims is to take a cognitive perspective , in which we interpret the AIs behaviour in terms of latent cognitive constructs, such as motivations , intentions , and goals . Because the same behaviour may be compatible with a range of underlying cognition—such as scheming , fitness-seeking , or aligned motivations—inferring cognition from a behavioural snapshot can be tricky. In this post, we introduce the idea of Developmental Cognitive Interpretability (DCI), which aims to model how cognitive constructs change over the course of training. Further, by understanding how cognition results from training pipelines, we can predict agent behaviour resulting from pipelines that have not yet been tested. We discuss core assumptions and philosophical background of DCI, and lay out a broader research agenda. We have some initial evidence that the methodology works in at least one toy setting, and our current main uncertainty is whether we can scale our approach to LLMs. We invite those interested in working on these problems to reach out to us at jrb239[at]cam[dot]ac[dot]uk and edward[at]geodesicresearch[dot]org. 1. Motivation Confidently predicting that an AI system will not cause harm in deployment is the central challenge of AI safety. Pre-deployment evidence of alignment must be collected on inputs we can safely test, but deployment will inevitably give the model dangerous inputs where misbehaviour could be catastrophic . Being able to confidently say that an AI will behave as desired out of its evaluation distribution requires us to predict its OOD behaviour. How might we do this? One approach is to try to understand what a model is doing internally at a mechanistic level. However, the most ambitious versions of Mechanistic Interpretability may be out of reach under short timelines. Alternatively, we can try to understand a model’s behaviour in terms of its cognition—that is, its motivations, goals, drives, intentions, and beliefs. One approach to alignment is then to give AIs safe motivations —those that generalise in the way we would want them to out-of-distribution. Inferring the motivations of an AI is made tricky because of behavioural degeneracy—the same behaviours may be compatible with multiple conflicting underlying motivations. For example, AIs that are playing the training-game or attempting to acquire deployment influence might display desired behaviours for reasons very different from true alignment. Even in the non-adversarial case, AIs might learn concepts subtly different from those we intend, which come apart only in deployment situations. 2. The Agenda To solve this problem, we propose formulating theories of how an AIs cognition develops over the course of training. We call this approach Developmental Cognitive Interpretability: modelling how OOD behaviour arises from a model's training pipeline via interpretable cognitive constructs. Unpacking it back-to-front: Interpretability : we want a gears-level understanding of why an agent will behave a certain way. This is where our ability to predict OOD behaviours will come from. Whilst we intend to build models that provide concrete numerical predictions of behaviour, we also want them to be usable as intuition pumps for informal reasoning too. [1] Cognitive : our explanations will be given in terms of theoretical constructs—latent variables interpreted as mental states and processes (goals, beliefs, preferences, motivations)—sitting a layer below behaviour and above internals. [2] In our theories, these constructs pay rent through their ability to predict behaviour. [3] We claim these constructs are the natural unit at which to reason about scheming, reward-seeking, and OOD generalisation. Developmental : we seek to model how these cognitive constructs evolve over the course of training, rather than reasoning about only those possessed at the end of training. Post-training objectives underspecify the agent’s behaviour across all domains, with pre-training and mid-training shaping motivations and steering how later training is generalised from. Additionally, by modelling the effects of each training stage, it becomes easier to compose the effects of multiple stages together. This allows us to predict cognition on training pipelines more complex than those tested. The agenda rests on four load-bearing assumptions, in increasing specificity: (A1) The OOD behaviour of AIs is non-arbitrary and has some kind of structure, but this structure is not necessarily readily interpretable. (A2) That structure can be captured by some interpretable latent variables that compress observations of an agent's behaviour (the cognitive construct). (A3) The evolution of these latents can be predicted with training information [4] alone ( i.e. , without needing behavioural or mechanistic data from the trained model itself). (A4) The training-to-latents and latents-to-behaviour mappings can be learnt from observing similar AIs, and will generalise to training pipelines and deployment situations that are different to those that were observed. If successful, we would have predictive tools for evaluating the effects of complex training pipelines, and a much stronger general understanding of LLM cognition that would allow us to make progress on questions such as the likelihood and potential effectiveness of scheming and reward seeking. Even short of full success, identifying where behaviour resists prediction would itself help flag areas where guarantees of safety might be difficult to achieve even by other methods, useful for technical, policy, and advocacy work. 3. Worked Example: RL agents trained to navigate a maze In this section, we demonstrate how we apply the ideas discussed above in a toy setting. For the full detail, see our paper . We trained CNN-based RL agents on tasks in which they had to navigate to a goal object within a maze. Goal objects each had a shape and a colour—for example, red diamonds or blue crosses. We train each agent on a pipeline consisting of first being trained to pursue one goal, and then a different one: for example, black plusses followed by red circles. We then attempted to predict the OOD behaviour of agents in a forced choice setting—specifically, we placed agents in mazes in which two goals (with different shape-colour combinations) were present, and measured their propensity to pursue one goal over another. How do the four assumptions laid out above apply to our case? (A1) Structured OOD behaviour . We found that, although the agents were only ever exposed to training environments with a single goal at a time, and only to two goals total out of a possible 24 colour-shape combinations, their OOD behaviour was coherent and had obvious structure. For example, agents trained on red diamonds would often pursue red-coloured objects in the forced-choice setting, and agents trained on blue crosses would often pursue cross-shaped objects. (A2) Capturing this structure with latent cognitive constructs . In this case, the OOD behaviour of each agent was well captured by a small set of values which predicted pairwise choice probabilities across all possible forced choices. Specifically, assigning a value to each colour-shape combination and using a Boltzmann-rational model of choice allow us to compress 276 forced-choice probabilities into a set of just 24 interpretable score values. (A3) Predicting latent evolution with training information . We develop a methodology for predicting how these score values will evolve over the course of training which we call latent policy gradient . For any given training pipeline, we are able to use LPG to predict the value scores that our RL agents will possess at the end of training. (A4) Predicting unseen pipelines . We further show that our method can predict the OOD behaviour of agents trained on held-out pipelines, by understanding the effects of individual pipelines. This paper uses relatively simple models of both cognition—Boltzmann rationality over score values—and development—our latent policy gradient method. However, we think this is an important proof-of-concept for the overall approach, and are excited to scale up our methods to more sophisticated models of cognition and development appropriate for LLMs. 4. Why we expect this to scale to LLMs We developed and tested our methodology in a toy setting of CNN-based RL agents pursuing colour-shape combinations in mazes, and found that it worked effectively. Encouraged by our early results, we have some reasons to expect why this agenda should be fruitful when we turn our attention to LLMs. We recap the assumptions underpinning our agenda and evaluate to what extent we already have existing evidence for or against them. (A1) Structured OOD behaviour. This holds on many domains, and LLMs seem to have identifiable values , with their systematic behavioural tendencies grow with training scale . However, LLMs can also exhibit highly conditional behaviours and are influenced by spurious correlations in post training . (A2) Capturing this structure with latent cognitive constructs. This has been demonstrated across behavioural and mechanistic approaches. The values of LLMs seem amenable to modelling with Boltzmann-rational and Thurstonian approaches, and we’re finding low-dimensional internal representations of cognitive phenomena such as personas . (A3) Predicting latent evolution with training information, and (A4) predicting unseen pipelines. These have not been directly demonstrated in LLMs, but there are results that provide evidence that they might hold. Neural scaling laws demonstrate that LLM next token prediction loss is itself easily predicted by training information, with broader training-data to behaviour relationships having predictable structure across scales . Alignment techniques inspired by cognitive-level reasoning seem effective both for pre-training and mid-/post-training , and the coherence of cognitive models of LLM capabilities and preferences increases with scale . Initially surprising results show consistency across model sizes, model families, and datasets , and also seem to have interpretable latent causes . Indirect evidence aside, properly testing these assumptions is our next focus. 5. Open problems & call to engage There's lots of work to be done! Here are some research questions we're interested in, both ones that can be started upon immediately, and ones which are more long-term directions. Whether Developmental Cognitive Interpretability can scale to LLMs at all. We're actively working on applying latent policy gradients to simple character-training-style pipelines and seeing how they shape LLM behaviour on forced-choice value rankings. The hope is to recover a notion of personas in the form of how optimising for certain character traits and values are correlated with one another. Exploring toy settings more thoroughly. Testing how different architectures and RL algorithms generalise, testing more complicated training pipelines, and testing other toy settings. Expanding the search space of cognitive models. We've already done some follow-up on this in our toy setting, but we're hoping to find cases where our simplest models fail before resorting to more complex ones. We’re also excited to explore cognitive models with deeper structure, such as motivational DAGs . Applying DCI to informal cognitive theories like the Persona Selection Model , Behavioural Selection Model , and Shard Theory . This allows us to formalise these theories, test them, and iterate on them. We have some ideas about what this might look like, but we will not be able to properly test them until we’ve validated the general approach works for LLM behaviour. Exploring broader training paradigms than goal-based RL. For example, RLHF, DPO, deliberative alignment, prompt-distillation, SDF, and AI debate. By coming up with methods to apply DCI in each of these paradigms, we give ourselves the building blocks to model complex training pipelines used for frontier AIs. Using DCI to understand the effects of frontier training pipelines. This is the main goal of the DCI agenda, and would require significant progress on all the previous open problems. If you find any of this interesting or promising, please get in touch! We think a lot of people are starting to have ideas in this broad direction, and it seems worth trying to co-ordinate this effectively. Jason will be at EAG London 2026 this weekend and would be glad to talk about any of this in person. Finally, we’re also interested in any pushback and concerns people have about this research direction. ^ To contrast, see this paper for an example of LLM behavioural modelling that is not interpretable. ^ In Marr's terms , cognitive constructs sit at the computational/algorithmic level, whereas weights and activations sit at the implementational level. ^ Rather than, e.g. , by reducibility to features or activation patterns . ^ By this we mean all inputs to the training process, so this could include details of model architectures or optimisers in order to account for their inductive biases. Discuss
Score: 39🌐 MovesMay 29, 2026https://www.lesswrong.com/posts/oCcGiDzWYQeJkhhZY/developmental-cognitive-interpretability-a-research-agenda-1 - ServiceNow’s stock soars to a historic month as AI fears fade across software
ServiceNow shares gained over 40% this month, leading an industrywide relief rally among enterprise software companies.
- Accelerating Drug Discovery: Leveraging XtalPi’s Intelligent Software for Faster Breakthroughs
Accelerating Drug Discovery: Leveraging XtalPi’s Intelligent Software for Faster Breakthroughs azcentral.com and The Arizona Republic
- XtalPi: Defining the Next-Generation R&D Paradigm Through AI for Science
XtalPi: Defining the Next-Generation R&D Paradigm Through AI for Science azcentral.com and The Arizona Republic
- TGI Expands Sovereign AI Logistics Footprint with Agricultural Supply Chain Strategic Alliance
TGI Expands Sovereign AI Logistics Footprint with Agricultural Supply Chain Strategic Alliance USA Today
- Agentic AI success helps UiPath swing to a profit, but investors weren’t impressed
Business automation software company UiPath Inc. delivered mixed results in its latest quarter, posting a solid revenue beat but falling short on earnings — but it did at least manage to return to profitability. The company reported first-quarter earnings before certain costs such as stock compensation of 15 cents per share, falling just shy of […] The post Agentic AI success helps UiPath swing to a profit, but investors weren’t impressed appeared first on SiliconANGLE .
Score: 39🌐 MovesMay 29, 2026https://siliconangle.com/2026/05/28/agentic-ai-success-helps-uipath-swing-profit-investors-werent-impressed/ - How Together AI built the world’s fastest speech-to-text stack
Together AI built the fastest speech-to-text stack on Artificial Analysis by treating ASR as a full-path systems problem, not just a GPU inference problem.
Score: 39🌐 MovesMay 29, 2026https://www.together.ai/blog/how-together-ai-built-the-worlds-fastest-speech-to-text-stack - AI Models Need Sleep: CMU Research Shows Performance Boost from 'Napping' LLMs
CMU and University of Maryland researchers show that LLMs benefit from a 'sleep' mechanism that consolidates long-context information, improving complex reasoning performance.
Score: 39🌐 MovesMay 29, 2026https://pandaily.com/ai-models-need-sleep-cmu-research-performance-may2026 - Pope’s encyclical raises questions on who gets to shape AI
Pope Leo XIV during his weekly general audience in the Vatican on May 27, 2026.
Score: 39🌐 MovesMay 29, 2026https://restofworld.org/2026/pope-ai-encyclical/?utm_source=rss&utm_medium=rss&utm_campaign=feeds - How AI is making assistance for the visually impaired more accessible
Aira has developed an AI model with Google DeepMind that helps the visually impaired navigate daily life.
Score: 39🌐 MovesMay 29, 2026https://www.semafor.com/article/05/29/2026/how-ai-is-making-visual-assistance-more-accessible - How the Pope’s Magnifica Humanitas offers a template for individuals to meet the AI moment
Pope Leo XIV’s new encyclical on artificial intelligence includes a statement that warrants serious attention from technologists and policymakers: “Technology is never neutral.” Magnifica Humanitas (“Magnificent Humanity”) is a clarion call to all people to act with courage and solidarity as we enter an age already being transformed by artificial intelligence, the greatest change in…
- The Vatican’s Man Inside Anthropic
Pope Leo XIV may not be able to disarm AI, but he’s got the attention of the industry.
- Building Fixed HW Implementations of Neural Networks (Yale, Cornell et al.)
Researchers from Yale University, Cornell University, Boston University, and NTT Research have published “Physical Foundation Models: Fixed hardware implementations of large-scale neural networks”. Abstract “Foundation models are deep neural networks (such as GPT-5, Gemini~3, and Opus~4) trained on large datasets that can perform diverse downstream tasks — text and code generation, question answering, summarization, image... » read more The post Building Fixed HW Implementations of Neural Networks (Yale, Cornell et al.) appeared first on Semiconductor Engineering .
Score: 39🌐 MovesMay 29, 2026https://semiengineering.com/building-fixed-hw-implementations-of-neural-networks-yale-cornell-et-al/ - Graph Time-Frequency Mixed Anomaly Detection framework achieves 99.71% accuracy detecting sensor attacks on drones
A new machine learning framework designed to detect malicious interference in unmanned aerial vehicles (UAVs), commonly known as drones, has shown strong performance in identifying both sudden and slow-developing sensor attacks, according to research in the International Journal of Automation and Control. The system, called GTF-MAD (Graph Time-Frequency Mixed Anomaly Detection), achieved a peak F1 score of 99.71% in detecting bias in tests on a quadrotor drone.
Score: 38🌐 MovesMay 29, 2026https://techxplore.com/news/2026-05-graph-frequency-anomaly-framework-accuracy.html - AI and data sovereignty in Postgres: An answer to the datacenter energy crisis
A billion AI agents walk into a power grid
- Google adds AI shopping insights to Merchant Center
Google is giving retailers new AI visibility metrics in Merchant Center, offering a closer look at how products surface in conversational shopping results. The post Google adds AI shopping insights to Merchant Center appeared first on MarTech .
Score: 38🌐 MovesMay 29, 2026https://martech.org/google-adds-ai-shopping-insights-to-merchant-center/ - If an AI agent cannot find you in Southeast Asia, you do not exist in the market
For B2B tech firms and growth-stage companies eyeing the Southeast Asian prize in 2026, the traditional market entry playbook is officially broken. You have hired the local country manager. You have booked the regional tech conference slots. You have even landed a few prestigious headlines in national business dailies. Yet, when a regional CTO asks […] The post If an AI agent cannot find you in Southeast Asia, you do not exist in the market appeared first on e27 .
Score: 38🌐 MovesMay 29, 2026https://e27.co/if-an-ai-agent-cannot-find-you-in-southeast-asia-you-do-not-exist-in-the-market-20260523/ - Why relying on AI content detectors is a bad idea—and what you should do instead
AI content generators are being used by the masses—everyone from students to playwrights to content marketers are turning to these tools to help them churn out content faster. So it should come as no surprise that AI content detectors are also being adopted to check how much of a given piece of content is written by AI. It's not just teachers checking students' essays or editors checking writers' articles. It works the other way around, too. For example, I spent hours running my writing sample
- Barcelona’s Mafer AI raises €2 million to build an AI operating system for R&D teams in formulation industries
Mafer AI, a Barcelona-based startup building an AI operating system for R&D teams in formulation industries, has closed a €2 million pre-Seed funding round backed by Kfund, 4Founders Capital, Masia and Lavanda Ventures, the startup investment arm of the Puig family. It has also secured backing from leading business angels, including Adrián Mato (Andreessen Horowitz […] The post Barcelona’s Mafer AI raises €2 million to build an AI operating system for R&D teams in formulation industries appeared first on EU-Startups .
- 'AI adoption has become a game of chance': Employees are being left to navigate AI tools on their own as businesses fail to implement proper training
Only around half of the workers using AI regularly have had any formal training from their employers.
- Run Step 3.7 Flash on NVIDIA GPUs with Enterprise-Ready Multimodal AI
AI applications are moving beyond text generation to multimodal systems that can perceive, search, and reason across images, documents, video, and...
Score: 38🌐 MovesMay 29, 2026https://developer.nvidia.com/blog/run-step-3-7-flash-on-nvidia-gpus-with-enterprise-ready-multimodal-ai/ - LuxRemix Dataset
LuxRemix Dataset AI at Meta
- Hexo Labs Open-Sources SIA: A Self-Improving Agent That Updates Both the Harness and the Model Weights
Hexo Labs Open-Sources SIA: A Self-Improving Agent That Updates Both the Harness and the Model Weights MarkTechPost
- "The pitchforks are here": Billionaires work to contain AI's populist revolt
America's billionaires are developing their own prescriptions for AI-fueled inequality, anxious to defuse a populist revolt aimed at their ballooning fortunes. Why it matters: The AI boom has dramatically raised the stakes of the wealth-tax debate, unleashing a technology that could wipe out millions of jobs while minting the world's first trillionaires. Populist politicians, particularly on the left, have cast this as capitalism's next great reckoning : an even deeper concentration of wealth and power in an economy already rigged for the elite. Zoom in: Some of the richest men in tech have warned for years AI could destabilize the economy. Many suggest the answer is not deceleration or wealth taxes, but shared abundance. Jeff Bezos, the world's fourth-richest man, said on CNBC last week that the bottom 50% of earners should pay zero federal income tax. "You could double the taxes I pay and it's not going to help that teacher in Queens," the Amazon founder argued. Sam Altman, the CEO of OpenAI and a longtime proponent of universal basic income , now favors "universal basic compute" — giving people access to AI's productive power instead of a fixed cash payment. OpenAI went further in April with a New Deal-style social contract that proposed a public wealth fund, taxes on AI-driven returns and automated labor, and a four-day workweek. Elon Musk, whose SpaceX IPO could help make him the world's first trillionaire, has called for "universal HIGH INCOME" checks from the federal government — arguing robots will drive so much growth that inflation won't follow. Between the lines: The billionaires and AI leaders floating these ideas are keenly aware that the politics of extreme wealth could turn dangerous fast. In a January essay , Anthropic CEO Dario Amodei made what he called "a pragmatic argument" for billionaires to support higher taxes on AI wealth. "If they don't support a good version," Amodei wrote, "they'll inevitably get a bad version designed by a mob." OpenAI named the same risk in its April policy blueprint , warning that AI could leave "power and wealth becoming more concentrated instead of more widely shared." Its foundation put money behind that anxiety Wednesday, committing $250 million to help workers and communities weather the disruption — and to test new ways to share AI's gains before the backlash hardens. The big picture: Anti-billionaire politics has become an organizing principle for the Democratic Party, which remains in search of a durable post-Trump identity. In Congress, Sen. Elizabeth Warren (D-Mass.) called Wednesday for overhauling the tax code , including new taxes on wealth and data centers, to ensure Americans share in the economic gains of AI. Warren — who is being courted by potential 2028 presidential candidates — cited Silicon Valley's own warnings about a "permanent underclass" displaced by AI. In New York City, state lawmakers this week passed Mayor Zohran Mamdani's pied-à-terre tax on luxury second homes above $5 million — a measure he controversially promoted in a video outside hedge-fund billionaire Ken Griffin's $238 million Manhattan penthouse. In Maine, Democratic Senate frontrunner Graham Platner launched his campaign by declaring that "the enemy is the oligarchy." He's backed by Sen. Bernie Sanders (I-Vt.) and Rep. Alexandria Ocasio-Cortez (D-N.Y.), who are more than a year into their nationwide "Fighting Oligarchy" tour. In California, unions say they have gathered more than 1.5 million signatures to put a one-time 5% billionaire wealth tax on the November ballot, aiming to fund health care, education and food assistance programs. The intrigue: Former hedge fund manager Tom Steyer, who is running for governor as a progressive, has endorsed the measure, casting himself as "the billionaire who wants to tax other billionaires." California Gov. Gavin Newsom, a likely 2028 presidential candidate, opposes the measure — but has urged Democrats not to ignore the populist forces it represents. "The pitchforks [are] here, they're not just coming," Newsom said last week , warning that resentment toward billionaires and AI-driven automation will dominate the 2026 and 2028 elections. The bottom line: The billionaire tax fight is becoming a test of whether AI creates shared prosperity — or a level of wealth concentration that Amodei warns could "break society."
- Are you afraid AI will take your job? Gov. Gavin Newsom wants to hear from you
Are you afraid AI will take your job? Gov. Gavin Newsom wants to hear from you The Mercury News