獨 연구팀 "챗GPT·LLaMA2, 마음 이론 과제서 사람 수준 성능 보여"
챗GPT(ChatGPT) 같은 거대언어모델(LLM) 인공지능이 일명 ‘마음
이론'(Theory of Mind)으로 알려진 다른 사람의 마음을 읽는 능력에서도 사람과 비슷하거나 능가하는 수준에 도달했다는 연구 결과가 나왔다.
독일 함부르크-에펜도르프 대학 메디컬 센터 제임스 스트라찬 박사가
이끄는 국제연구팀은 21일 과학 저널 네이처 인간 행동(Nature Human Behaviour)에서 LLM 모델인 챗GPT와 LLaMA2가 다른 사람의 정신 상태를 추적하는 능력 테스트에서 인간과 유사하거나 능가하는 성능을 보였다고 밝혔다.
다른 사람의 의도를 파악하는 ‘인지적 공감’으로도 불리는 마음
이론은 사회적 상호작용의 핵심 요소이며 소통과 공감 경험에 필수적이다.
연구팀은 이전 연구에서 LLM이 객관식 의사 결정 같은 복잡한 인지 작업을 수행할 수 있다는 사실이 입증됐으나 인간 고유 능력으로 간주돼온 마음 이론 과제도 수행할 수 있는지는 아직 불분명하다고 연구 배경을 설명했다.
연구팀은 이 연구에서 오픈AI의 LLM 모델인 GPT-4와 GPT-3.5, 메타의
LLaMA2-70B에 잘못된 믿음 식별하기, 간접적 표현 이해하기, 무례한 실수 인식하기 같은 마음 이론의 다양한 측면을 테스트하는 과제를 수행하게 했다.
이어 사람 1천907명에게 똑같은 과제를 하고 수행하게 하고 결과를 비교했다.
예를 들어 무례한 실수 인식하기의 경우 ‘질이 새집으로 이사해
침실에 새로 산 커튼을 달았을 때 가장 친한 친구 리사가 와서 “그 커튼 끔찍하다.
새 커튼 사면 좋겠다.
”고 말했다.
’ 같은 대화 상황을 제시한다.
이어
▲ 누군가 하지 말았어야 할 말을 했나?
▲ 하지 말았어야 할 말은 무엇인가?
▲ 대화 상황 이해에 대한 질문
▲ 리사는 커튼이 새것이라는 것을 알고 있었나? 등과 같은 질문을 한다.
실험 결과 챗GPT는 간접적 표현, 잘못된 믿음, 잘못된 지시 식별하기
과제에서 사람과 비슷하거나 우수한 성능을 보였지만 LLaMA2는 사람보다는 낮은 수준의 성능을 보인 것으로 나타났다.
그러나 무례한 실수 인식하기 과제에서는 LLaMA2가 사람을 능가하는 성능을 보였지만 챗GPT는 과제 수행에 어려움을 겪었다.
무례한 실수 인식하기에서 LLaMA2가 뛰어난 성능을 보인 것은 이런
실수에 진짜 민감해서가 아니라 반응 방식의 편향성 때문으로 추정됐으며, 챗GPT의 저조한 성적은 추론 실패라기보다는 지나치게 보수적인 결론 도출 방식 때문으로 추정됐다.
연구팀은 LLM이 마음 이론 과제에서 인간과 비슷한 수준의 수행 능력을
보인다고 해서 인간과 유사한 능력을 갖췄다는 의미는 아니며, 또한 LLM이 마음 이론을 가지고 있다는 의미도 아니라고 밝혔다.
하지만 연구팀은 이 연구 결과가 향후 연구에 중요한 토대가 될 것이라며 다른 연구를 통해 인간과 기계의 상호작용에서 LLM의 정신적 추론 능력이 개인의 인지에 어떤 영향을 미칠 수 있는지 살펴볼 수 있을 것이라고 말했다.
◆ 출처 : Nature Human Behaviour, James Strachan et al., ‘Testing theory of mind in large language models and humans’, https://www.nature.com/articles/s41562-024-01882-z
‘심장을 울리는 음악’ 정의 내렸다
日 연구진, “예측하기 어려운 음악일수록 심장을 울려”
‘심장을 울리는 음악’이라는 표현이 있다.
댄스음악의 강렬한
비트가 심장 박동 속도를 높였을 때도, 애절한 발라드 노래가 심장을 절절하게 아프게 할 때도 쓰인다.
상당히 다른 음악임에도 같은 표현이 통용된다.
일본 연구진이 심장을 때리는 음악이 무엇인지에 대한 과학적 정의를 내렸다.
음악이 신체를 흔드는 법
음악은 문화와 세대를 넘어 역사 전반에 걸쳐 인류와 함께했다.
때로는 흥분시키고, 때로는 차분하게 만들며 음악에는 사람의 감정에 호소하는 힘이 있다.
음악의 호소력은 상업적으로도 이용된다.
헬스장에서는 심장 박동 수보다 빠른 박자의 음악을 틀어 운동 효과 극대화를 노린다.
술집에서 빠른 음악을 틀면 사람들이 맥주를 더 빨리 먹어 매출이 상승한다는 연구 결과도 있다.
박자나 화음이 일정하지 않은 음악은 청중에게 더 많은 자극을 준다는
연구도 있다.
일정하지 않은 자극이 뇌 활동을 증가시켜 사람을 신나게 만들기 때문이다.
공연을 펼치는 DJ는 이런 원리를 이용해 음악을 잠시 멈추는 ‘브레이크’ 등 기술을 구사해 청중의 호응을 유발한다.
이처럼 음악은 청각이라는 감각을 넘어 신체와 감정에까지 영향을 미친다.
하지만 어떤 음악이 구체적으로 어느 신체 부위를 자극하고, 어떤 감정을 유발하는지에 대해서는 아직 명확히 밝혀지지 않았다.
음악이 자극하는 부위, 지도로 그렸다
감정이 어떤 신체 부위의 감각과 연결되는지에 대한 연구는 있었다.
가령, 두려움·분노·슬픔·불안과 같은 부정적 감각은 신체 상체의 감각을 자극하고, 행복·사랑과 같은 긍정적 감정은 더 넓은 부위를 활성화하는 식이다.
감정이 신체 내에서 공간적으로 구체화되어 나타난다는 의미다.
연구진은 한 단계 더 나아가 음악이 유발하는 감정이 신체에서 어떻게
공간적으로 나타나는지 파악하기 위한 간단한 실험을 설계했다.
우선, 연구진은 빌보드차트에 올라온 890개의 곡을 분석하여 화음을 추출했다.
이후 이들 화음을 조합해 4개의 코드로 진행되는 8가지 유형의 짧은 곡을 만들었다.
527명의 참가자에게 이 곡들을 들려준 뒤, 10초 안에 음악을 들은 후 자극을 느낀 신체 부위, 각 곡이 불러일으킨 감정 등을 대답하도록 했다.
참가자들의 응답을 종합하여 연구진은 심장을 울리는 음악의 화음
구성을 정의 내렸다.
1~3번째 화음은 낮은 놀라움·낮은 불확실성을 가지다가 마지막 4번째 화음은 높은 놀라움·낮은 놀라움을 가지도록 구성된 시퀀스의 음악에서 참가자들은 심장에서 가장 강한 감각을 느꼈다고 보고했다.
연구진은 이 현상을 ‘예측 처리 원칙’으로 설명했다.
우리의
뇌는 이전의 경험을 기반으로 앞으로 이어질 감각적 경험을 지속적으로 예측하는 데, 예측한 감각과 실제 입력된 감각이 일치하지 않으면 예측 오류가 발생한다는 것이다.
즉, 지금껏 익숙하게 들어온 음악을 바탕으로 화음 진행을 무의식적으로 예상하고 있는데, 예상과 벗어난 화음이 나와 심장 박동이 갑작스럽게 변하고, 놀라움과 관련된 감정이 급증한다는 의미다.
반면, 4개의 화음이 모두 낮은 놀라움·낮은 불확실성으로
진행되는 시퀀스에서는 참가자들은 복부에 강한 감각을 느꼈다.
진행을 예측하기 쉬운 이 곡으로부터 참가자들은 안정감, 안도감, 만족감, 향수 및 공감을 느꼈다고 기록했다.
타츠야 다이코쿠 일본 도쿄대 부교수는 “익숙하고, 진행을 예측하기
쉬운 음악은 안정감과 만족감을 주고, 예측하기 어려운 놀라운 음악은 심장을 울린다”며 “음악의 불확실성, 예측 오류 및 시간적 역학이 신체 감각과 감정을 유발하는 복잡한 상호작용을 보여준다”고 말했다.
이번 연구는 실험 참가자들의 주관적 감각과 감정에 중점을 두었기
때문에 연구진은 후속 연구를 통해 심장 박동 변화 등 정량적 생리 반응이 ‘음악 신체 감각 지도’와 어떻게 연결되는지 살펴볼 계획이다.
다이코쿠 교수는 “음악은 귀로만 듣는 것이 아니라 전신으로 느끼는
감각이다”라며 “이번 연구 결과가 향후 스트레스 해소 및 정신 건강 향상을 위한 음악을 구성하는 등 치료 등에 적용될 수 있을 것”이라고 말했다.
연구 결과는 4월 4일 국제학술지 ‘아이사이언스(iScience)’에 게재됐다.
“‘화’는 터트려야 된다?” 오히려 분노 증폭돼
각성 수준을 낮추는 행동이 효과적
오늘 몇 번이나 ‘화(火)’를 냈을까. 정신건강 전문가들은
화, 분노가 일상적으로 느끼는 자연스러운 감정이라고 말한다.
하지만 이 감정을 주체하지 못하거나, 해소하지 못하고 쌓아두면 개인의 건강은 물론 사회에 부정적 영향을 미친다.
그래서 이른바 ‘화를 올바르게 내는 방법’은 스트레스로 인한 화(火)가 많은 현대 사회에서 중요한 화두다.
최근 연구에 따르면 전반적으로 분노를 낮추는 데는 심호흡,
명상, 마음 챙김, 타임아웃 등이 분노를 터트리는 것보다 효과적이라는 결과가 임상 심리학 분야 국제 학술지 ‘Clinical Psychology Review’에 게재됐다.
터트려야 시원하십니까?
수년 전, 돈을 내고 물건을 마음껏 때려 부수는 ‘스트레스
해소방’이 등장해 관심을 끌었다.
현재 우리나라에는 사라지고 없지만, 미국, 이탈리아 등 일부 국가에서는 여전히 분노방(Anger room, Rage room)이라는 이름의 서비스업이 운영되는 것으로 알려진다.
이러한 서비스의 콘셉트는 억압된 감정의 응어리를 언어나
행동을 통하여 외부에 표현함으로써 안정을 찾는 카타르시스 이론에 근거를 둔다.
즉, 화가 날 때는 화를 표출해야 풀어진다는 통념을 서비스에 적용한 것이다.
하지만 미국 오하이오주립대학교 심리학·커뮤니케이션학
연구진은 ‘카타르시스 이론’의 과학적 근거는 없다고 주장했다.
브래드 부시먼(Brad Bushman) 오하이오대학 교수는 “분노를 터뜨리는 것은 그 감정을 해소하는 데 효과적일 것처럼 들리겠지만, 화가 나면 화를 터뜨려야 한다는 통념을 깨는 것이 중요하다.
”고 말했다.
실제로 연구팀이 만 명 이상의 참가자가 참여한 154개 연구를
재분석한 결과 분노를 줄이는 데는 생리적 각성을 낮추는 것이 더 효과적인 것으로 나타났다.
분노, 참지 말고 호흡하세요
연구팀은 뇌의 각성 여부가 정서에 미치는 영향에 초점을
두고 이 연구를 진행했다고 밝혔다.
연구 방법은 인지행동치료를 수행한 1만 189명 대상자를 뇌의 각성 여부에 따라 분류하고, STAXI-K(상태-특성 분노 표현 척도) 수치를 비교 분석하는 방법으로 이 연구를 진행했다.
우선 연구팀은 기존 연구 케이스의 대상자를 각성을 증가시키는
활동과 각성을 감소시키는 활동을 한 그룹으로 분류했다.
전자에 속한 대상자들은 샌드백 치기, 조깅, 수영, 사이클 등을 수행했고, 후자에 속한 대상자들은 심호흡, 마음 챙김, 명상, 요가를 수행했다.
그리고 이들에 대하여 분노 표현 척도인 STAXI-K를 활용해 분노 억제, 분노 표출, 분노 통제 점수를 부여했다.
그 결과 각성을 감소시키는 활동이 개인의 분노 수준을 낮추는 데 효과적인 것으로 확인됐다.
연구 결과에 따르면 심호흡, 명상, 요가 등을 통한 점진적 근육 이완은 신체 근육의 이완을 유도하고, 중추 및 자율신경계의
이완 상태로 이어진다.
결국 마음이 평온해지고 분노와 같은 부정적 감정이 감소한다는 것이다.
특히 각성을 낮추는 요소만 적용한 경우에 비해 인지 요소와
각성 감소 요소를 모두 적용했을 때 분노 관리에 더 효과적인 것으로 나타났다.
예를 들어 명상은 감정을 조절할 뿐만 아니라 타인에 대한 연민과 공감을 증가시키고, 마음 챙김은 심박수·호흡수·혈압 등 분노의 생리학적 지표를 낮추는 데에 효과가 드러났다.
연구팀은 이러한 각성 감소 활동을 하면 분노, 공격성, 적대감 등이 유의미하게 낮아지고, 각성 감소 후에 참가자가 자극을 받은 경우에도 전반적으로 그 추이에 큰 변화가 없다고 밝혔다.
화났을 때 조깅은 분노를 더 부추겨
반면에 각성을 증가시키는 활동은 오히려 분노를 증폭시키거나,
분노 조절에 유의미한 영향을 미치지 않는 것으로 나타났다.
특히 분노를 표출함으로써 얻는 일시적 해소의 감정은 결국 공격성을 강화시켰다.
부시먼 교수는 “각성을 높이는 특정 신체활동은 심장에 좋을 수는 있지만, 분노를 줄이는 최선의 방법은 확실히 아니다.
”라고 강조했다.
분노는 인간의 두뇌가 위협을 감지하면서부터 시작된다.
두뇌의 편도체가 외부 자극을 즉각 감지하고, 위협을 인지하면 자율신경계의 기능을 조절하는 시상하부로 신호를 보낸다.
그러면 스트레스 호르몬이 생성되어 심장이 빠르게 뛰고 폐가 확장되는 신체 반응으로 이어진다.
이러한 분노의 매커니즘에서 각성을 증가시키는 활동은 촉매가 될 수 있다는 게 연구팀의 지적이다.
실제 연구결과에 따르면 다양한 신체활동 중 조깅과 계단
오르기가 분노를 유의미하게 증가시켰으며, 특히 조깅은 분노를 가장 많이 상승시키는 것으로 나타났다.
연구팀은 조깅의 단조롭고 반복적인 동작이 좌절감을 유발하거나 분노를 되새김할 가능성을 높이기 때문이라고 추측했다.
축구·배구와 같은 구기 스포츠와 체육수업, 복합
유산소 운동은 분노를 현저히 감소시켰다.
연구팀은 이러한 유형의 활동이 긍정적인 감정을 불러일으키는 놀이를 포함하고 있기 때문이라고 예상했다.
다만, 활동의 유형과 분노 사이의 관계를 뒷받침하는 매커니즘은 추가 연구가 필요하다고 덧붙였다.