참신함에서 필수성으로: AI가 모든 사람에게 접근성 있는 세상을 열어줄 수 있는 방법


Apple과 Google과 같은 회사는 사진 편집 및 메시지 초안 작성과 같은 작업에 AI를 사용합니다.
하지만 이 급성장하는 기술의 가치는 디지털 접근성을 높이는 데에도 있을 수 있습니다.

지팡이를 짚은 시각 장애인 여성이 주변에 있는 신원 불명의 사람들과 배경에 있는 디지털화된 눈 사이를 걷고 있습니다.<BR>

AI의 발전으로 일부 사람들에게 디지털 접근성 도구를 더 쉽게 사용할 수 있게 될 수 있습니다.

Getty Image/ Zooey Liao/CNET

7월의 어느 화창한 날, 케빈 차오와 저는 캘리포니아 오클랜드의 바람이 부는 옥상에 앉아 도심 스카이라인을 내려다보았습니다.
그는
메타의 레이밴스마트 안경을 꺼내 쓰고 보이는 것을 설명해 보세요라고 물었습니다.

약간의 문제 해결이 필요합니다(처음에는 안경이 협조하지 않음). 하지만 몇 번 시도한 후, AI 조수가 내장 카메라를 사용하여 검은색 테이블과 의자가 스카이라인을 바라보는 파티오를 설명합니다.

그 설명은 확인되었습니다.
시각 장애인인 Chao는 몇 초 안에 주변을 살펴볼 수 있습니다.
안경의 Meta AI 기능 덕분입니다.
Meta View 앱을 통해 iPhone과 페어링하기만 하면 됩니다.

저는 암벽등반과 스키와 같은 야외 활동을 많이 합니다.
접근성 옹호자인 차오가 말했습니다.
메타 레이밴을 사용하여 지형을 파악하는 것 외에도 사진을 찍는 데도 편리합니다.
그는 저는 휴대전화와 정확한 위치에 대해 걱정하는 대신 일반적인 방향을 바라봅니다.
라고 말했습니다.
그는 안경과 함께 휴대전화 에서
AiraBe My Eyes와 같은 앱을 사용하여 AI와 시력이 있는 자원봉사자에게 접근하고 주변 환경에 대한 세부 정보를 얻습니다.

Meta AI의 옥상 설명은 특별히 자세하거나 미묘하지 않습니다.
예를 들어 의자가 위커로 만들어졌다는 사실이나 지붕 가장자리에 라벤더가 있다는 사실은 언급하지 않습니다.
하지만 이 기술의 현재 역량과 미래 약속은 장애인에게 디지털 접근성을 보다 직관적이고 유용하게 만들 수 있는 잠재력을 보여줍니다.
또한 값비싼 추가 장비의 필요성을 없애고 대신 사람들이 휴대전화에서 바로 강력한 도구를 사용하거나 300달러짜리 안경(주머니에 든 돈은 아니지만 완전히 비싼 것도 아님)을 사용할 수 있게 함으로써 접근 가능한 기술을 민주화하는 데 도움이 될 수 있습니다.

최근 몇 년 동안 Apple과 Google과 같은 회사는 모바일 접근성 제공을 강화하기 위해 AI 군비 경쟁에 뛰어들었습니다.
예를 들어 Apple의
Live Speech기능을 사용하면 말하고 싶은 내용을 입력한 다음 Apple 기기에서 큰 소리로 들을 수 있고,Eye Tracking을사용하면 사람들이 눈만으로 iPhone과 iPad를 제어할 수 있습니다.
Google은 AI를 사용하여
오디오 및 촉각 신호를 통해 시각 장애인 및 저시력 Pixel 사용자가 잘 구성된 사진을 찍을 수 있도록 돕는
Guided Frame과 사물을 식별하고자세한 이미지 설명을 생성할 수 있는Lookout과 같은 기능을 구동합니다.
두 기술 거대 기업은 청각 장애인 또는 난청인이
오디오 콘텐츠에 액세스하는 데 도움이 되는실시간 자막 도구를출시했습니다.

생성 AI 분야에서 가장 두드러진 플레이어 중 하나인 OpenAI도 Be My Eyes와 협력하여Be My AI를 출시했습니다.
Be My AI는 사람과 비슷한 음성을 통해 주변 환경에 대한
실시간 세부 설명을제공합니다. 예를 들어 누군가가 택시를 잡으면 Be My AI는 택시 표시등이 켜져 있는지, 운전자가 어디에 정차하는지 알려줄 수 있습니다.
AI가 보조 기술을 보다 개인화하고 접근 가능하게 만들 수 있는 방법을 보여주는 놀라운 사례입니다.
필요한 것은 앱과 스마트폰뿐입니다.

빈틈을 메우다

iPhone의VoiceOver 및 Android 휴대폰의TalkBack과 같은 화면 판독기 기술은시각 장애인 또는 시력이 약한 많은 사람들에게 게임 체인저였습니다.
스마트폰에서 10년 이상 사용 가능한 이 기능은 사람의 기기에서 콘텐츠를 소리 내어 읽어주고 사용자 지정 제스처를 통해 터치스크린을 탐색할 수 있도록 합니다.

Google은 5월에 Gemini NanoAI 모델을 스마트폰에 통합하여 TalkBack 스크린 리더를 강화했습니다. 이제 TalkBack은 온라인 쇼핑 시 옷의 스타일과 컷과 같이 레이블이 지정되지 않은 이미지에 대한 더 자세한 설명을 제공할 수 있습니다.

시각 장애인 접근성 전문가 조엘 아이작은 AI가 실제로 변화를 만들어낼 수 있는 부분이 바로 그런 뉘앙스와 세부 사항을 추가하는 부분이라고 말합니다.

당신이 보는 것과 당신이 보고 있다고이해하는것 사이에는 진짜 인지적 층이 있습니다 . 아이작은 말한다.
저에게는 그 인지적 격차가 없습니다.
주변 환경이나 화면에 있는 것에 대한 간단한 설명을 얻는 것은 도움이 될 수 있지만, 항상 전체 그림을 그리는 것은 아닙니다.

AI는 그 격차를 메울 잠재력이 있습니다.
아이작은 말한다.
ChatGPT [구동] 장치나 그 이후에 나오는 것 같은 것에서 설명을 얻는 것은 정말 대단한 일입니다.

음성 인식 기술도 AI 붐의 혜택을 받고 있습니다.
Google의
Gemini 어시스턴트Apple의 Siri는모두 대화형이고 맥락을 인식하여 후속 질문에 응답하고 보다 포괄적인 답변을 제공할 수 있습니다.
Project Relate라는 Android 베타 앱은 Google Assistant에 연결하여 비표준 음성을 사용하는 사람들이 더 잘 이해하도록 할 수 있습니다.
그리고
Listen for Atypical Speech라는 새로운 Siri 기능을 통해 음성 어시스턴트는 기기 내 머신 러닝을 사용하여 이러한 패턴을 인식하여 더 광범위한 음성을 더 잘 해독할 수 있습니다.

Siri 업데이트는 일리노이 대학교 어바나-샴페인 캠퍼스와 Apple, Amazon, Google, Meta, Microsoft를 포함한 유명 기업의 협업인Speech Accessibility Project라는 이니셔티브의 결과물입니다 . 목표는 다양한 음성 패턴과 장애가 있는 사람들의 음성 인식을 개선하는 것입니다.

UIUC의 전기 및 컴퓨터 공학 프로젝트 리더이자 교수인 마크 하세가와-존슨은 이전 인터뷰에서CNET에 음성 기술로 가장 큰 혜택을 볼 그룹 중 하나는 여러 가지 신체 장애가 있는 사람들입니다.
라고 말했습니다
. 그리고 너무나 자주, 그들은 음성 기술이 작동하지 않는 사람들입니다.

Microsoft의 접근성 담당 수석 설계자인 메리 벨라드는 스마트 어시스턴트가 더욱 보편화되고 강력해짐에 따라 비표준 음성에 대한 지원을 보장하는 것이 더욱 시급하다고 말합니다.
이 이니셔티브에 참여한 회사들은 이를 실현하는 가장 효과적인 방법은 협업이라는 것을 금세 깨달았습니다.

우리 모두는 매우 유사한 데이터가 필요했습니다.
벨라드가 말했습니다.
우리는 장애가 있는 사람이 어떤 기술을 선택하든, 어떤 기술을 사용해야 하든 음성 인식에 대한 더 나은 경험을 하도록 하고 싶었습니다.

개인화의 힘

AI는 접근성 기능에 보다 개인화되고 진정한 터치를 줄 수 있습니다.
타이핑된 문구를 소리 내어 말하는 Apple의 Live Speech 기능과 함께, 말을 잃을 위험이 있는 사용자가 자신과 비슷한 목소리를 만들 수 있는
Personal Voice 기능도 있습니다.
일련의 텍스트 프롬프트를 소리 내어 기능을 훈련한 후, 누군가의 iPhone 또는 iPad는 머신 러닝으로 구동되는 거의 동일한 목소리를 생성합니다.

반언어 자폐증 환자인 엔데버* 코빈은 매일 Personal Voice를 사용한다고 말합니다.

저는 논바이너리라서 저처럼 들리는 디지털화된 목소리를 찾는 게 정말 어려워요. 코빈이 말했다.
사용 가능한 모든 목소리는 매우 높은 음조, 매우 낮은 음조, 매우 시스젠더 코드화되었거나 매우 어린 소리입니다.

Personal Voice는 환영할 만한 대안을 제공합니다.
저는 제 목소리가 중간 음역대이고, 트랜스코딩되고, 어른스럽게 들리고, 제가 자란 악센트와 거의 일치하기를 바랍니다.
… Personal Voice가 출시되기 전에는 음성 뱅킹을 위한 유일한 옵션은 매우 비쌌고, 물론 저는 그 결과가 마음에 들지 않을지 전혀 몰랐습니다.
그래서 Personal Voice는 정말로 게임 체인저입니다.

Google의Project Relate앱은 비표준어를 사용하는 사람들이 말하는 내용을 기록하고 컴퓨터화된 음성으로 다시 표현함으로써 다른 사람들과 더 쉽게 소통할 수 있도록 설계되었습니다.
Android 앱은 사람들의 고유한 음성 패턴에 맞게
맞춤 훈련될 수도 있습니다 .

대부분 사람들에게는 현재의 AI 도구가 지름길을 가고 생산성을 높이는 반짝이는 새로운 방법처럼 보인다는 것을 알 수 있습니다.
하지만 저는 AI가 장애인들이 사회에 더욱 온전히 참여할 수 있게 해주기를 진심으로 바랍니다.

Team Drea Foundation의 회장이자 창립자인 Andrea Peet

디미트리 카네브스키는 Google DeepMind의 연구 과학자로, Google의 AI 연구실입니다.
그는 모든 회의와 프레젠테이션을 할 때 Project Relate를 사용한다고 말합니다.
사실, 그는 Google Meet에서 저와 채팅할 때도 사용했습니다.
화면의 한쪽에는 카네브스키가 보였고, 다른 쪽에는 Project Relate에서 생성된 라이브 필사본이 보였습니다.
항상 정확하지는 않았지만(때로는 반복해야 했습니다) 일반적으로 이 앱은 그의 연설을 해석하는 데 훌륭한 성과를 보였습니다.

카네브스키는 Project Relate와 같은 앱이 안경에 내장되어 더욱 원활하고 섬세한 상호작용이 가능한 미래를 예상합니다.

그는 사람들과 소통할 때 휴대폰을 보고 있다면 상대방의 표정을 알아차리지 못할 것이라고 지적했습니다.

ALS 연구 기금을 모금하는 Team Drea Foundation의 사장 겸 설립자인 Andrea Peet도 프레젠테이션을 할 때나 이메일과 문자 메시지를 작성할 때 Project Relate를 사용합니다.
ALS를 앓고 있는 그녀는 키보드나 마우스가 아닌 눈의 움직임으로 기기를 제어할 수 있는 시선 고정 컴퓨터를 사용하는 것보다 앱이 훨씬 빠르다고 말합니다.

그녀는 Project Relate를 Google Home에 연결하여 Google Home이 그녀의 말을 더 잘 이해하고, 전등을 켜거나 온도 조절기를 바꾸는 등의 명령을 수행할 수 있도록 했습니다.

모든 사소한 일을 위해 일어나야 하는 것보다 훨씬 쉽고 효율적이며, 더 의미 있는 작업을 위해 움직이는 데 시간과 에너지를 절약할 수 있습니다.
라고 Peet은 말합니다.
그리고 다른 사람에게 많은 도움을 의지할 필요가 없기 때문에 독립성과 안전을 유지하는 데 도움이 됩니다.

이는 AI의 발전이 장애인의 크고 작은 작업을 얼마나 더 쉽게 만들어 줄 수 있는지 보여주는 한 가지 예일 뿐입니다.

대부분 사람들에게 현재의 AI 도구가 지름길을 가고 생산성을 높이는 반짝이는 새로운 방법처럼 보인다는 것을 알 수 있습니다.
Peet가 말했습니다.
하지만 저는 AI가 장애인이 사회에 더욱 온전히 참여할 수 있도록 해주기를 진심으로 바랍니다.

모든 사람의 이익을 위한 기술

접근 가능한 기술의 가장 큰 부작용 중 하나는 장애가 있는 사람뿐만 아니라 모든 사람에게 이롭다는 것입니다.
예를 들어 닫힌 자막을 살펴보겠습니다.
많은 사람들이 닫힌 자막
에 의존하게 되었는데, 특히 영화와 TV 대화를알아듣기 어려워졌기 때문입니다. 일부 사람들의 가독성을 개선할 수 있는 다크 모드와 TikTok과 같은 소셜 미디어 앱에서 필수인 텍스트 음성 변환과 같은 다른 기능도 일반화되었습니다.

우리는 모두 매일 접근성 기능을 사용합니다.
우리는 그것을 깨닫지 못할 수도 있지만, 우리는 그것을 사용합니다.
색상 대비, 휴대전화의 핀치 및 확대/축소 [또는] 화면의 텍스트 크기를 늘리는 것이라고 ServiceNow의 부사장 겸 글로벌 접근성 책임자인 이먼 맥얼린은 말합니다.
기업들은 '기본적으로 접근성에 집중하면 모든 사용자에게 도움이 된다'는 것을 깨닫고 있습니다.

접근성이라는 단일 목적을 위해 명확하게 만들어지지 않은 AI 기능은 여전히 ​​해당 영역에서 유익할 수 있습니다.
예를 들어,
검색 결과를 짧은 요약 형태로 요약하는 Google의
AI Overviews는 샌프란시스코의LightHouse for the Blind and Visually Impaired에서 Accessible User Experience를 담당하는 Sean Dougherty와 같은 사람들에게 큰 도움이 되었습니다 . 시력이 약한 Dougherty는 화면 판독기를 사용하여 Google 검색 결과 페이지를 걸러내는 대신 페이지 상단의 AI Overviews를 참조하여 찾고 있는 내용에 대한 간략한 요약을 얻을 수 있습니다.

그것은 모든 사람에게 유용한 정보 검색의 격차를 메워줍니다.
라고 그는 말합니다.
하지만 장애가 있는 사람이라면 훨씬 더 쉽고 효율적이게 됩니다.

그리고 이제 Google의 Gemini Live가출시되면서사람들은 음성만으로 AI 모델과 상호 작용할 수 있습니다.
즉, 필요한 것을 얻기 위해 텍스트 입력에만 의존할 필요가 없습니다.
이를 통해 더 직관적이고 간소화된 경험을 할 수 있습니다.
(ChatGPT에는
고급 음성 모드라는 유사한 기능이 있어 사용자가 AI와 대화할 수 있습니다.)

기업들은 '기본적으로 접근성에 집중하면 모든 사용자에게 도움이 된다'는 사실을 깨닫고 있습니다.

ServiceNow의 부사장 겸 글로벌 접근성 책임자 Eamon McErlean

자율주행 자동차는 특히 기업에서 더 많은 디지털 접근성 기능을 통합함에 따라 사람들에게 승차 요청을 할 때 더 큰 자율성을 제공할 수 있습니다.

Google 모회사인 Alphabet의 자율주행 부문인 Waymo의 초기 테스터인Dougherty는 인간 운전자와 소통할 수 없는 도착하는 차량을 고정하는 것이 과제 중 하나라고 언급했습니다.
이제 Waymo One 앱에는 누군가를 차량으로 안내하는 데 도움이 되는 방향 GPS 기능이 포함되어 있습니다.
iOS의 VoiceOver 또는 Android의 TalkBack을 사용하면 시각 장애인 및 저시력 사용자는 차량의 위치와 거리를 추적하는 데 도움이 되는 실시간 방향 피드백을 음성으로 들을 수 있습니다.
차량에 탑승하면 휴대폰을 사용하여 음악을 재생하거나 턴바이턴 GPS를 활성화하여 목적지에 대한 자세한 정보를 얻을 수 있습니다.

AI 도구는 민감한 문서나 정보에 대한 도움이 필요한 경우 사용자에게 더 많은 프라이버시를 제공할 수도 있습니다.
예를 들어, 누군가는 다른 사람과 세금이나 금융 정보를 공유하고 싶어하지 않지만 안전하고 암호화된 AI 기반 앱을 사용하여 해당 문서를 스캔하고 읽는 것이 더 편안할 수 있습니다.

그렇다고 인간적 연결이 여전히 가치 있는 때가 없다는 것은 아닙니다.
결국 Be My AI는 사용자에게
인간 자원봉사자에게 연락할수 있는 옵션을 계속 제공하고 있습니다 .

때로는 다른 사람과 직접 연결하는 데 가치가 있습니다.
Dougherty가 말합니다.
아직도 존재하는 접근성 장벽이 너무 많기 때문에 - 물리적 장벽이든 최적화되지 않은 디지털 공간의 장벽이든 - [장애인 커뮤니티의 사람들은] 우리 주변에 있는 도움과 지원을 줄 수 있는 개인에게 다가가는 데 익숙합니다.

웹 접근성 옹호자이자 Global Accessibility Awareness Day의 공동 창립자인 조 데본은 궁극적으로 중요한 것은 기술이 사람마다 다른 방식으로 작동할 수 있도록 하는 것이라고 말합니다.

일반인에게 효과적인 것을 만드는 것이 훨씬 쉬울 수도 있습니다.
데번은 말한다.
하지만 모든 엣지 케이스를 추적하고 엣지 케이스를 작동하게 만들면 새로운 기술이 다른 차원으로 올라갑니다.

더욱 접근하기 쉬운 미래를 건설하다

디지털 접근성을 개선하기 위한 현재 작업의 대부분은 장애인에 대한 광범위한 감독을 시정하는 것으로 시작됩니다.
그리고 AI와 관련하여 접근성 옹호자들은 역사가 반복되지 않도록 하기를 원합니다.
특히 기술이 빠르게 진화함에 따라 더욱 그렇습니다.

AI 모델은 데이터를 기반으로 훈련되며, 그 데이터에는 소외된 커뮤니티, 특히 장애인에게 영향을 미칠 수 있는 모든 종류의 편견이 포함됩니다.
시각 장애인인 GitHub의 접근성 책임자 에드 서머스가 말했습니다.
우리는 접근성에 대한 기본 진실과 모델을 구축하는 데 사용하는 훈련 데이터를 식별하는 데 진정한 과제를 가지고 있습니다.

이를 달성하기 위해, 회사에서는 장애인 커뮤니티에서 자주 사용되는 주문인 우리 없이는 우리에 대한 아무것도 없다를 따르는 것이 중요합니다.
즉, 장애인을 고용하고 제품과 도구를 만들거나 코드를 작성할 때 장애인과 상의하는 것을 의미합니다.

Summers는 우리에 대한 결정이 내려진다면,라고 말했습니다.
우리도 그 테이블에 앉아야 합니다.

10년 후에는 더 이상 접근성 감사를 위해 인간을 비판하지 않을 것입니다.
우리는 AI 개발을 비판할 것입니다.

Taylor Arndt, 접근성 전문가

AI에 대한 잘못된 정보데이터 개인정보 보호와 관련된 일반적인 불안 외에도, 급속한 발전으로 인해 일부 그룹이 다시 간과될 수 있다는 근본적인 두려움이 있습니다.

AI와 관련된 모든 것과 마찬가지로, 저는 데이터 오용의 가능성이 있다는 것을 알고 있습니다.
Peet가 말했습니다.
하지만 저는 기술적 도약이 너무 빨리 일어나서 접근성에 집중할 대역폭이 없기 때문에 뒤처지는 사람이 누구인지 아무도 주의를 기울이지 않을까봐 훨씬 더 걱정입니다.

AI가 코드를 빠르게 생성하는 능력은 한 가지 예일 뿐입니다.
모델은 이미 나와 있는 것에서 가져오고, 그 소스 자료의 대부분은 처음부터 접근할 수 없기 때문에, 생성하는 코드도 마찬가지입니다.

쓰레기가 들어가면 쓰레기가 나온다고 시각 장애인 접근성 전문가 테일러 아른트는 말한다.
그녀는 코더가 접근 가능한 코드를 작성하고 작업을 확인하는 법을 배우고 교육 기관이 커리큘럼에서 접근성을 우선시하는 것이 필수적이라고 지적한다.

업계 파트너와 파트너 대학의 교수진이 협업하는 Teach Access와 같은 조직은학생과 교육자가 접근성에 대해 배울 수 있는 무료 프로그램을 제공합니다.
Arndt와 다른 사람들은 또한
OpenAI의 ChatGPT 스토어에서 코드를 확인하여 접근성을 확인하고 문제를 해결할 수 있는 사용자 지정 GPT를 만들었습니다.
그녀는 AI의 부상으로 인해 코드를 면밀히 조사하는 방식이 바뀔 것이라고 예측합니다.

10년 후에는 우리는 더 이상 접근성 감사를 위해 인간을 비판하지 않을 것입니다.
Arndt가 말했습니다.
우리는 AI 개발을 비판할 것입니다.

AI의 미래와 가능성에 대해 Summers는 큰 기대를 하고 있습니다.
그는 AI 로봇이 식료품점에서 음식을 주문하고, 식사를 준비하고, 그 후에 청소하는 것과 같은 더 복잡한 작업을 할 수 있는 세상을 꿈꿉니다.
그것은 장애가 있는 사람뿐만 아니라 일상적인 작업에 도움이 필요한 모든 사람에게 도움이 될 것이라고 그는 말합니다.

피트는 가전제품이 비표준 음성을 이해하여 오븐을 예열하고, 냉장고에 무엇이 있는지 확인하고, Ring 도어벨에 대답하는 등의 작업을 표준 음성을 사용하는 사람들이 현대 기술을 사용하는 것과 마찬가지로 원활하게 수행할 수 있는 세상을 꿈꿉니다.

대부분 사람들에게는 참신하고 편리한 기술이지만, 이동성과 말하기에 어려움을 겪는 사람들에게는 정말 획기적인 기술이 될 것입니다.
라고 그녀는 말합니다.

한편, 오늘날의 급속한 AI 개발은 이미 오클랜드 옥상에서 저에게 Meta Ray-Bans를 시연해 준 접근성 옹호자인 Chao와 같은 사람들에게 가능성의 세계를 열어주고 있습니다.
그는 이제 Aira와 Microsoft의
Seeing AI와 같은 앱을 사용하는 방법을 보여줍니다 . 이 앱은 오디오 출력을 통해 테이블에 놓인 휴대전화와 선글라스를 설명합니다.

Seeing AI를 사용하여 Chao가 내 사진을 찍고, 앱은 나를 모자를 쓰고 행복해 보이는 26세 여성이라고 설명합니다.
실제로 30세이고 히잡을 쓰고 있는 사람으로서, 저는 이 답변에 기쁩니다.
어떤 면에서는 AI가 무엇을 할 수 있는지, 그 한계와 더 정확하고 섬세한 답변을 하기까지 얼마나 긴 시간이 필요한지에 대한 스냅샷을 제공합니다.

Chao는 또한 AI가 언젠가 제공할 수 있는 것에 대한 웅장한 비전을 가지고 있습니다.
아마도 결국 하이킹 지형과 암벽 등반 경로를 설명할 수 있는 스카우트 역할을 더 많이 할 것입니다.
그러면 저는 스포츠를 제게 적응시키는 데 도움이 되는 자원봉사자나 유료 전문가에게 제한을 받거나 의존하지 않게 됩니다.

시간문제일 수도 있겠죠.


댓글 쓰기

Welcome

다음 이전