user-image
최승호 (tigerant_btc)
Research Analyst/
Xangle
2024.11.08

목차

1. 우리는 데이터의 중요성을 간과하고 있다.
1-1. 빠르게 성장하고 있는 AI산업, 데이터의 수집과 라벨링 기술도 진화해 왔다.
1-2. 하지만 데이터는 인간의 손을 거칠 수밖에 없다.

2. AI 산업의 데이터 파운드리가 되고자 하는 Pundi AI
2-1. AI 산업 내 블록체인의 역할에 대해 현실적으로 접근한 Pundi AI
2-2. Pundi AIFX, 토큰화된 AI 데이터의 옴니체인으로 탈바꿈하는 FunctionX
2-3. ‘Tag to Earn’과 데이터 마켓플레이스로 데이터 시장에 도전장을 내밀다

3. Pundi AI 플랫폼이 데이터로 만들어내는 가치
3-1. Pundi AI 플랫폼의 이해관계 구조
3-2. $FX 토큰(추후 $AIFX 토큰으로 변경 예정)의 유틸리티
3-3. 트위터 데이터 수집과 라벨링에 최적화된 PURSE+
3-4. PUNDI AI PitchFest 프로그램

4. Pundi AI의 탈중앙 데이터 플랫폼은 AI 데이터 시장의 킥이 될 수 있을까

 

 

1. 우리는 데이터의 중요성을 간과하고 있다.

Open AI의 ChatGPT 등장 이후, 생성형 AI 애플리케이션이 쏟아져 나오면서, 알파고 이후 AI 산업은 다시 한 번 큰 변곡점을 맞이했다. Open AI의 GPT-3 모델을 시작으로 GPT-4o와 o1 모델, 앤트로픽의 Claude, 페이스북 메타의 LLaMA 등 다양한 LLM(Large Language Model)과 음성 및 영상 생성 모델들이 발전했다.

우리는 발전 중인 모델의 성능과 그러한 성능을 뒷받침하는 아키텍처, 혹은 컴퓨팅 파워에만 집중하고 있어, AI 모델의 성능은 ‘데이터의 질’에 의해 결정된다는 사실을 간과하는 경향이 있다. OpenAI 연구원 제임스 벳커(James Betker)는 블로그를 통해 "좋은 데이터만이 좋은 모델로 귀결된다"고 언급하며, 데이터의 중요성을 강조했다. 이와 같이 정밀하고 신뢰성 높은 AI 모델을 개발하기 위해서는 고품질의 데이터가 필수적이다. 고품질의 데이터란, 단순히 대규모의 데이터를 수집하는 것을 넘어, 이를 정제하고 적절히 라벨링하는 것을 포함한다.

1-1. 빠르게 성장하고 있는 AI산업, 데이터의 수집과 라벨링 기술도 진화해 왔다.

AI 산업은 기술의 발전과 함께 급속도로 성장하고 있으며, 이에 따라 데이터 수집 및 라벨링 시장 규모도 빠르게 확장되고 있다. 과거에는 데이터 라벨링이 주로 인간의 수작업에 의존하였으나, 최근에는 AI 보조 라벨링 시스템Reinforcement Learning from Human Feedback(RLHF) 같은 기법들이 등장하여 데이터 라벨링의 효율성과 정밀도를 크게 향상시키고 있다. 예를 들어, OpenAI의 GPT 모델은 RLHF를 활용해 사용자가 선호하는 답변을 지속적으로 피드백 받아, 데이터의 품질과 적합성을 지속적으로 개선하고 있다. 이와 같은 혁신은 AI 모델의 정확도와 신뢰성을 한층 높이며, 데이터 전처리 과정의 핵심적인 도구로 자리 잡았다.

1-2. 하지만 데이터는 인간의 손을 거칠 수밖에 없다.

그럼에도 불구하고 데이터는 결국 인간의 손을 거쳐야만 한다. AI 모델을 학습하는 방법은 크게 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning) 두 가지가 있으며, 두 방법 모두 데이터의 정확성과 유용성을 보장하기 위해서는 인간의 개입이 필연적이다. 지도학습에서는 인간의 분류 작업을 거쳐 라벨이 있는 데이터셋(Data Set)이 필수적이며, 이러한 라벨링된 데이터가 정확하지 않으면 AI 모델은 학습을 통해 잘못된 결과를 생성하게 된다. 비지도학습의 경우에도, AI 모델이 자체적으로 분류한 결과를 검증하고 평가하기 위해 인간의 판단이 요구된다. 결국, 어떠한 AI 훈련 방법이든지 간에 인간의 직관과 전문 지식이 결합되어야만 데이터가 정확한 정보를 제공할 수 있는 것이다. 데이터의 품질이 AI 모델의 성능을 좌우하기 때문에, 데이터 생성 과정에서 인간의 역할은 여전히 중요하다는 점을 잊지 말아야 한다. 

Pundi AI는 이러한 데이터 생성 과정의 중요성을 인지하여 블록체인을 활용해 데이터 제공자의 기여를 투명하게 기록하고, 라벨링 데이터의 품질과 신뢰성을 보장하며, 데이터 거래 과정을 공정하고 효율적으로 개선하고자 한다. Pundi AI는 암호화폐 페이먼츠에 특화된 PundiX와 코스모스 기반의 EVM 호환 체인인 FunctionX가 결합하여 탄생하였다. 이와 같은 변신은 오랜 기간 페이먼츠 사업을 하며 쌓아온 PundiX의 결제 시스템 노하우와 이더리움 및 코스모스 생태계로 브릿징이 가능한 FunctionX의 상호운용성이 AI 데이터의 거래와 활용 부분에 있어 좋은 시너지 효과를 낼 수 있을 것이라는 전략적 판단 하에 진행된 것으로 사료된다.

 

2. AI 산업의 데이터 파운드리가 되고자 하는 Pundi AI

2-1. AI 산업 내 블록체인의 역할에 대해 현실적으로 접근한 Pundi AI

누차 강조하듯, AI 모델의 구조와 연산 능력도 중요하지만, AI 모델이 실제로 학습하고 활용하는 데이터의 품질과 다양성이 모델 성능의 성패를 좌우한다. 그러나 현실적으로 AI 산업 내 데이터의 수집과 활용 과정은 여러 가지 문제에 직면해 있다. 데이터 소유권이 명확하지 않고, 데이터 제공자에게 돌아가는 보상은 투명하지 않으며, 데이터의 신뢰성 또한 보장 받기 어려운 상황이다.

Pundi AI는 이러한 문제를 해결하기 위해 블록체인 기술을 도입한 탈중앙화 AI 데이터 생태계를 제안한다. Pundi AI의 비즈니스 접근 방법은 현실적이다. 대형 테크 기업과 경쟁하여 AI 모델 자체를 개발하려 하기보다는, 데이터를 수집하고 라벨링하는 ‘파운드리’ 역할에 초점을 맞추고 있다. 이는 AI를 개발하고 튜닝하며 활용하는 주체들에게 데이터라는 연료를 공급함으로써, AI 생태계의 기반을 강화하려는 전략이다.

하지만 오늘날의 챗지피티와 같은 AI 파운데이션 모델의 경우 학습하는 데이터의 양이 인간이 라벨링 할 수 있는 데이터의 수를 뛰어넘는 수준이기에, 탈중앙 플랫폼에서의 인간이 파운데이션 모델에 직접적으로 기여하는데 한계점이 보이는 것은 사실이다. 결국, 파운데이션 모델을 구체적인 용도로 파인튜닝(fine-tuning)한 수 많은 소규모 “도메인 특화 모델(Domain-Specific Model)” 또는 "목적 특화 AI(Task-Specific AI)”의 개발에 있어, 이와 같은 탈중앙 데이터 플랫폼의 가치를 증명할 수 있는 지가 앞으로 Pundi AI가 보여줘야할 과제일 것으로 예상된다.

2-2. Pundi AIFX, AI 데이터 옴니체인으로 탈바꿈하는 FunctionX

Pundi AI 생태계에서 데이터를 토큰화하고 전송하는 블록체인 기술은 Pundi AIFX가 담당하게 된다. 이는 이전의 FunctionX 체인이 리브랜딩한 것으로, AI 데이터의 상호운용성을 담당하는 데이터 옴니체인 역할을 할 예정이다. Pundi AIFX(현 FunctionX)는 블록체인 간에 토큰화된 AI 데이터의 전송과 거래를 가능하게 하며, AI 데이터를 블록체인과 결합하는 역할을 수행한다.

Pundi AIFX(현 FunctionX)는 Cosmos SDK를 기반으로 구축되었으며, 다양한 Cosmos 및 EVM 호환 네트워크와 연결할 수 있는 상호운용성을 제공한다. 각 체인과 연결된 브릿지를 통해 토큰화된 AI 데이터의 이동이 원활하게 이루어지며, AI 생태계 내에서 데이터를 보다 자유롭게 활용할 수 있도록 한다.

무엇보다도, AI 데이터 생성에 블록체인의 스마트 컨트랙을 도입하면서 데이터 보호와 보상 구조에도 신뢰성과 투명성을 부여할 수 있게 되었다. 데이터는 NFT 형태로 토큰화되어 소유권이 명확히 보장되며, 데이터 사용 시 스마트 계약을 통해 자동으로 보상이 제공된다. 모든 거래는 블록체인 상에 투명하게 기록되므로, AI 학습 데이터의 출처를 확인할 수 있다는 점에서 신뢰성을 갖게 된다.

2-3. ‘Tag to Earn’과 데이터 마켓플레이스로 데이터 시장에 도전장을 내밀다

Pundi AI는 ‘Tag to Earn’ 모델을 통해 탈중앙 구조의 AI 데이터 시장에 경제적 동인을 만들어 내고자 한다. 기존의 "Play to Earn" 방식이 단순히 게임 활동을 통해 보상을 제공했다면, "Tag to Earn"은 보다 생산적인 작업에 초점을 맞춘다. 이 모델은 참여자가 데이터를 태깅하거나 주석을 추가하는 작업을 통해 AI 학습에 필수적인 데이터를 제공하는 동시에, 직접적으로 경제적 보상을 받을 수 있도록 설계되었다. 이는 AI 산업에서 필요로 하는 데이터를 효과적으로 공급하기 위한 작업 참여자들을 확대하는 동기를 부여할 것으로 예상된다.

Pundi AI 플랫폼은 최종적으로 데이터 제공자와 사용자 간의 연결을 가능하게 하는 탈중앙 AI 데이터 마켓플레이스(연내 출시 예정)를 제공한다. 이 마켓플레이스는 목적에 따라 라벨링된 데이터를 쉽게 검색하고 구매할 수 있도록 도와주며, 데이터 기여자에게는 공정한 보상을 제공함으로써 데이터 산업의 신뢰성을 높인다. 데이터 거래내역은 블록체인 상에 기록되며, 데이터의 출처와 무결성이 명확히 관리된다.

 

3. Pundi AI 플랫폼이 데이터로 만들어내는 가치

3-1. Pundi AI 플랫폼의 이해관계 구조

Pundi AI 플랫폼은 AI 데이터 생태계의 다양한 이해관계자들—데이터 제공자, 처리자, 검증자, 사용자—로 구성된 탈중앙화 데이터 플랫폼이다. 참여자와 데이터의 상호작용 속에서 데이터의 생성부터 활용까지 모든 과정이 투명하고 공정하게 이루어진다.

데이터 제공자는 텍스트, 이미지, 음성, 비디오와 같은 원본 데이터를 업로드하여 플랫폼에 초기 데이터를 공급한다. 데이터 처리자는 제공된 데이터를 AI 학습에 적합한 형태로 가공해 모델의 성능에 직접적으로 기여한다. 데이터 검증자는 데이터의 품질과 정확성을 보장하며, 이를 통해 신뢰할 수 있는 데이터를 만든다. 마지막으로 데이터 사용자는 AI 모델 개발자나 기업으로, 필요 데이터를 구매하고 활용해 AI 모델의 성능을 개선한다.

이 모든 과정은 블록체인을 통해 투명하게 관리된다. 데이터 업로드부터 라벨링, 저장, 구매, 검증까지 모든 절차가 스마트 계약과 NFT를 통해 기록되고 관리되어, 데이터 소유권과 보상이 명확히 이루어진다. 이를 통해 데이터 기여자들은 공정한 보상을 받을 수 있고, 사용자는 신뢰할 수 있는 고품질 데이터를 빠르고 간편하게 확보할 수 있다.

다만, Pundi AI의 성공 여부는 데이터를 제공하는 참여자들이 얼마나 적극적으로 플랫폼에 기여할 것인지에 달려 있을 것으로 보인다. 데이터 제공이 원활히 이루어지지 않는다면, 플랫폼의 구조가 제대로 작동하기 어려울 수 있다. 따라서 플랫폼은 데이터 제공자를 유인할 수 있는 강력한 인센티브와 간소화된 프로세스를 제공해야 할 것으로 보이며, 전문 데이터를 지속적으로 제공 받을 수 있도록 데이터 라벨링과 전처리에 높은 관심을 가지고 있는 기관과의 파트너십에도 많은 노력이 필요할 것으로 예상된다.

3-2. $FX 토큰(추후 $AIFX 토큰으로 변경 예정)의 유틸리티

출처: Pundi AI Docs

Pundi AI의 토크노믹스, AI 플라이휠은 데이터, 기여자, 구매자가 상호 작용하며 AI 기술 발전을 촉진할 수 있는 선순환 구조로 설계되었다. 이 구조에서 $FX 토큰(추후 $AIFX 토큰으로 변경 예정)은 Pundi AI 생태계의 기축 통화로 사용될 것이며, 데이터를 제공하는 기여자와 데이터를 활용하는 사용자 사이를 연결하는 가교 역할을 할 예정이다. 사용자는 $FX를 사용해 데이터를 구매하고, 기여자는 제공한 데이터에 대해 공정한 보상을 받는다. 이 모든 과정은 블록체인과 스마트 계약을 통해 투명하게 이루어진다.

데이터 거래로 발생한 수익은 보상 풀로 들어가 주기적으로 기여자들에게 분배되며, 이는 스마트컨트랙을 통해 공정하고 투명하게 이루어진다. 데이터 처리자는 데이터 검증자의 검증이 끝나면 보상을 받을 수 있으며, 검증자의 보상도 함께 지급된다. 데이터 기여자는 혹여나 자신이 기여한 데이터가 채택되지 않은 경우에도 기본 보상을 받을 수 있도록 준비된 추가적인 인센티브를 제공받는다. 이러한 구조는 기여자의 노력을 보상하여 데이터 품질을 지속적으로 개선할 참여 동기를 제공한다. 또한, $FX 보상 풀은 스테이킹 기능을 제공하여 기여자가 보상을 장기적으로 축적하며 추가적인 수익을 얻을 수 있게 할 계획이다.

이와 같은 토크노믹스가 제대로 작동하기 위해선, 사람들의 참여를 이끌어낼 수 있을만큼의 충분한 보상이 제공되어야 할 것으로 보인다. Pundi AI의 AI 플라이휠이 원활하게 작동하기까지는 충분한 시간이 필요할 것으로 보인다.

3-3. 트위터 데이터 수집과 라벨링에 최적화된 PURSE+

PURSE+는 SocialFi(Social Finance)와 AI를 결합한 브라우저 플러그인으로, 사용자가 트위터 상에서 데이터를 수집, 태깅하고 분석하는 데 기여할 수 있는 플랫폼이다. PURSE+는 Pundi AI 이니셔티브의 일환으로, 커뮤니티가 주도하여 데이터의 다양성과 품질을 향상시키고 , AI의 역량을 강화하는 것을 목표로 하고 있다. PURSE+는 유저 친화적인 도구를 통해 기술적인 접근성이 낮은 사용자들까지도 데이터 생태계에 기여할 수 있는 기회를 제공하며, 이를 통해 AI 산업의 확장성과 지속 가능성을 크게 높이고 있다.

*이미지(오른쪽): 필자의 PURSE+ 실제 사용 모습 

PURSE+ 플러그인을 통해 사용자들은 일상적인 트위터 활동 속에서 SNS 데이터를 수집하고, 라벨링하는 작업을 수행할 수 있다. 그 과정에서 사용자들은 포인트를 모아 Purse+ 토큰으로 교환하여 실질적인 보상까지 받을 수 있다. 이와 같이 Purse+는 AI와 소셜 파이낸스(SocialFi)를 자연스럽게 연결하여 AI 개발을 위한 탈중앙 데이터 기여 환경을 제공하고 있다.

3-4. PUNDI AI PitchFest 프로그램

PUNDI AI의 AI Startup PitchFest는 전 세계 혁신적인 AI 스타트업들을 발굴하고 지원하기 위해 기획된 경쟁 프로그램이다. PitchFest 참가 스타트업들은 독창성과 혁신성, 시장성이 돋보이는 AI 솔루션을 제안함으로써 실질적인 AI 문제 해결 방안을 제시한다. 이들은 각 팀의 솔루션이 얼마나 시장 적합하고, 확장성을 가지며, 실질적으로 구현 가능한지를 평가받는다.

PitchFest의 최종 후보 팀들에게는 다양한 지원혜택이 제공된다. 최대 10만 달러에 달하는 인큐베이션 자금 및 각종 개발 지원 도구 지원과 더불어 싱가포르에서 6개월간 사무 공간을 무료로 사용할 수 있다. 물질적 지원 외에도 AI와 블록체인 분야 전문가로부터 멘토링을 받는 기회를 통해 사업 개발, 마케팅, 자금 조달 전략을 구체화할 수 있으며, Pundi AI의 파트너 및 고객 네트워크와의 연계를 통해 글로벌 시장 진출을 위한 발판을 마련하는 기회도 제공된다. 이와 같이 Pundi AI는 플랫폼과 연계되는 다양한 지원 활동들을 이어나갈 예정이다.

 

4. Pundi AI의 탈중앙 데이터 플랫폼은 AI 데이터 시장의 킥이 될 수 있을까

Pundi AI는 데이터의 중요성에 초점을 맞춰, AI 산업의 탈중앙 데이터 파운드리를 구축하려는 비즈니스 모델을 채택하였다. 기존의 중앙화된 데이터 수집 및 활용 방식에서 발생하는 소유권, 투명성, 보상의 문제를 해결하기 위해 블록체인 기술을 활용한 탈중앙 데이터 플랫폼을 선보이며, AI 생태계 내 블록체인의 역할을 새롭게 정의하고 있다.

특히, Pundi AIFX 옴니체인을 통해 플랫폼에서 생성한 토큰화된 데이터를, 다양한 블록체인 네트워크에 전송하며 데이터의 상호운용성을 극대화하려는 점은 주목할 만하다. 또한, ‘Tag to Earn’ 모델과 탈중앙 데이터 마켓플레이스(연내 출시 예정)는 데이터 제공자와 사용자 간의 협력을 강화하며, 공정한 보상을 통해 지속적인 참여를 장려하고 있다. 이러한 구조를 통해 데이터 제공자, 처리자, 검증자, 사용자 모두에게 혜택을 제공하는 생태계를 구축하고, AI 데이터의 품질과 다양성을 동시에 확보할 수 있을지 관심을 갖고 지켜봐야 할 것이다.

그러나 Pundi AI는 아직 초기 단계에 있는 만큼, Pundi AI 플랫폼의 성공까지는 상당한 과제들이 남아있다. 첫째, 데이터 제공자를 유치하기 위한 충분한 경제적 인센티브를 지속적으로 제공할 수 있을지의 여부가 중요하다. 둘째, 플랫폼이 제시하는 데이터 상호운용 구조와 토크노믹스가 실제로 효과적으로 작동하여 사용자들에게 실질적인 가치를 제공할 수 있어야 한다. 셋째, 제공되는 데이터가 B2B 고객들에게 충분히 유의미하여 그들이 경제적 대가를 지불하고 사용할 수 있어야 지속가능한 비즈니스 모델 구축이 가능할 것이다. 마지막으로, 도메인 특화 모델과 목적 특화 AI에 적합한 데이터를 제공하기 위해선, 관련 전문 데이터를 확보할 수 있는 다각적인 노력이 필요해 보인다.

이번 PundiX와 FunctionX의 AI 산업 피봇과 관련하여, 필자는 재단 관계자에게 AI의 인기에 편승하는 전략이 시장에서 유효할지 의문을 표했었다. 이에 대해 관계자는 산업의 발전 흐름에 맞춰 필요로 하는 역할로 역동적으로 전환하는 것이 더 의미 있는 방향이지 않겠냐고 대답하였다. 위에서 언급된 몇가지 과제들을 Pundi AI 플랫폼이 해결하고, AI 플라이휠 구조가 제대로 작동하여 AI 산업에서의 블록체인 기술의 유효성을 입증한다면, Pundi AI가 과거의 프로젝트에 머무르는 것이 아닌 AI와 블록체인 간의 결합을 이끄는 프로젝트가 될 수 있을 것이라 기대하며 글을 마치고자 한다.

주의사항
본 글에 기재된 내용들은 작성자 본인의 의견을 정확하게 반영하고 있으며 외부의 부당한 압력이나 간섭 없이 작성되었음을 확인합니다. 작성된 내용은 작성자 본인의 견해이며, (주)크로스앵글의 공식 입장이나 의견을 대변하지 않습니다. 본 글은 정보 제공을 목적으로 배포되는 자료입니다. 본 글은 투자 자문이나 투자권유에 해당하지 않습니다. 별도로 명시되지 않은 경우, 투자 및 투자전략, 또는 기타 상품이나 서비스 사용에 대한 결정 및 책임은 사용자에게 있으며 투자 목적, 개인적 상황, 재정적 상황을 고려하여 투자 결정은 사용자 본인이 직접 해야 합니다. 보다 자세한 내용은 금융관련 전문가를 통해 확인하십시오. 과거 수익률이나 전망이 반드시 미래의 수익률을 보장하지 않습니다. 본 글은 FunctionX의 요청으로 작성되었습니다. 본 글의 모든 내용은 작성자가 독립적으로 작성했고, ㈜크로스앵글 또는 의뢰자는 내용이나 편집에 영향을 미치지 않았습니다. 작성자는 본 글에 언급된 가상자산을 보유할 수 있습니다.
본 제작 자료 및 콘텐츠에 대한 저작권은 자사 또는 제휴 파트너에게 있으며, 저작권에 위배되는 편집이나 무단 복제 및 무단 전재, 재배포 시 사전 경고 없이 형사고발 조치됨을 알려드립니다.