편집자 메모: 다수의 제목을 포함한 이 블로그 포스트의 대부분은 ChatGPT가 작성했습니다. Kyle이 쓴 글은 이탤릭 서체로 작성되었습니다. 여기에서 이 포스트에 대한 ChatGPT와의 대화 내용을 확인할 수 있습니다. 듣기를 통해 이 블로그 포스트를 Kyle의 목소리로 들을 수 있습니다. Kyle은 해당 포스트의 글을 소리 내어 읽으며 녹음하지 않았습니다. 대신, play.ht라는 서비스에 오디오 샘플을 업로드하고 포스트의 텍스트를 제공하여 AI가 Kyle의 샘플 목소리를 사용해서 합성하게 했습니다.
암호화폐와 인공지능(AI)의 세계는 나란히 진화해 오고 있으며, 각 도메인은 기술과 혁신의 경계를 넓히고 있습니다. 우리가 이 두 분야에서 계속 진전해 나감에 따라, 두 분야의 미래가 불가분 관계에 있다는 사실이 점차 분명해지고 있습니다. 우리는 이 포스트를 통해 암호화폐와 AI가 만나는 지점의 네 가지 주요 교차점을 살펴 볼 것입니다.
"그래픽 카드용 AirBnB" 모델
AI 및 머신 러닝(ML) 워크로드의 증가로 Nvidia A100 같은 고성능 그래픽 카드에 대한 수요가 엄청나게 증가했습니다. 이에 대응하여 "그래픽 카드용 AirBnB"와 유사한 새로운 시장이 등장하게 되었습니다. 이 시장에서는 개인 및 조직이 사용하지 않는 GPU 리소스를 AI 연구자와 개발자의 수요 충족을 위해 임대할 수 있 습니다.
이는 시장 역사상 매우 독특한 현상입니다. GPU는 ChatGPT 출시 이전에도 이미 공급이 부족한 상태였습니다. 그 이후, 적어도 10x 혹은 100x 정도의 수요가 증가했을 것입니다. 게다가 이 모델은 학습 규모와 함께 대수적으로 향상합니다. 즉, GPU 컴퓨팅의 수요는 모델 품질이 선형적으로 성장하는 동안 기하급수적으로 증가합니다. 전체 공급이 수요를 한참 초과한다는 사실에도 불구하고 상품에 대한 수요가 이윽고 가용 공급을 크게 넘어섰던 적은 많지 않습니다. 세상에 모든 GPU를 오늘날의 AI 추론 및 학습에 사용할 수 있다면, 공급부족이 아니라 공급과잉 현상이 일어났을 것입니다!
하지만 "그래픽 카드용 AirBnB"의 개념을 살펴볼 때 고려해야 할 몇 가지 주요 기술적 과제가 있습니다.
- 모든 그래픽 카드가 모든 워크로드를 지원할 수 있는 것은 아닙니다. 각각의 그래픽 카드는 모양, 크기, 사양 등의 측면에서 다양합니다. 따라서 일부 GPU는 특정 AI 작업을 처리하지 못할 수도 있습니다. 이러한 모델이 성공적으로 작업을 수행하려면, 적절한 AI 워크로드와 이에 적합한 GPU 리소스를 매치하는 방법이 필요합니다. 시장이 점점 성숙해짐에 따라 다양한 AI 작업을 할 수 있도록 그래픽 카드의 전문화 및 최적화를 이루어 내야 합니다.
- 더욱 긴 지연 시간을 수용하기 위한 학습 프로세스 조정: 오늘날 대부분의 기초 모델(foundation model)은 매우 짧은 지연 시간 연결을 통해 GPU 클러스터 학습을 합니다. 그러나 분산 환경에서는 일부 대량 작업에 의해 지연시간이 증가합니다. 이는 GPU가 공용 인터넷을 통해 여러 위치에 분산되어 있을 가능성이 높기 때문입니다. 이러한 문제를 극복하기 위한 방법으로 지연 시간이 길 경우를 가정하는 새로운 학습 과정 개발이 있습니다. AI 모델 교육 방식을 재고함으로써 대형 GPU의 분산 클러스터 사용을 더욱 용이하게 할 수 있습니다.
- 인증 문제: 신뢰할 수 없는 컴퓨터가 특정 코드를 실행했는지 여부를 알 수 없습니다. 그러므로 신뢰할 수 없는 컴퓨터의 출력을 신뢰하는 데 어려움이 있을 수 있습니다. 그러나 암호화 경제 스테이킹(crypto-economic staking)과 결합된 평판 시스템, 그리고 경우에 따라서는 빠른 인증이 가능한 새로운 형태의 모델을 통해 해당 문제를 경감시킬 수 있습니다.
학습과 추론의 두 분야와 관련한 팀이 상당수 있습니다. Multicoin Capital은 Render Network에 많은 투자를 했는데, 초기에는 3D 렌더링에 중점을 두었으며, 이후에는 GPU 네트워크를 AI 추론 지원하는데 까지 확장했습니다.
Render Network 외에도 Akash, BitTensor, Gensyn, Prodia, Together, 그리고 아직 공개되지 않은 것 등이 몇 있습니다.
토큰 인센티브화 인간 피드백 기반 강화학습(RLHF)
토큰 인센티브화는 확실히 모든 인간 피드백 기반 강 화학습(RLHF)에 작동하지는 않습니다. 문제는 토큰 인센티브화가 RLHF에 들어맞을 때, 현금 지불(예를 들어 USDC)이 대신 이루어져야 할 때에 비해서 어떤 프레임워크를 사용해야 할 것인가입니다.
토큰 인센티브화는 다음 사항이 보다 사실화됨에 따라 RLHF를 개선할 가능성이 높습니다.
- 모델이 더욱 좁고 수직적인 형태가 됩니다.(ChatGPT 처럼 일반적이고 수평적인 형태와 반대됨) 만약 누군가 RLHF를 그들의 주 직업으로 제공하고 RLHF으로 수익의 대부분을 창출한다면, 임대료 지불과 식료품 구매를 현금으로 할 가능성이 높습니다. 일반적인 질문에서 벗어나 구체적인 도메인 영역으로 넘어감에 따라, 모델 개발자는 전반적인 사업 기회에서 장기적인 성공에 권한을 가질 가능성이 높은 고도로 숙련된 작업자의 참여가 필요할 것입니다.
- RLHF의 자체 작업 외에 사람이 제공하는 RLHF의 수익이 더 높습니다. 도메인 특정 RLHF 모델에 의미 있는 시간을 투자하는 데 있어서 그 위험을 정당화하기 위한 다른 시도를 통해 충분한 수익 혹은 저축이 발생한 경우, 현금을 대신한 보상으로써 락업(locked-up) 토큰 혹은 비유동 토큰만 받을 수 있습니다. 성공 확률을 극대화하기 위해 모델 개발자는 도메인 특정 RLHF를 제공하는 작업자에게 락업 해제 토큰(unlocked token)을 제공할 수 있습니다. 대신, 장기 의사 결정을 장려하기 위해 토큰을 일정 기간 동안 보장해야 합니다.
토큰 인센티브화 RLHF 모델을 적용한 산업으로는 다음과 같은 분야가 있습니다.
- 의료: 경량 및 1차 반응 진단뿐 아니라 장기 예방 및 장수 중심의 의료를 위해 LLM에 가담할 수 있어야 함
- 법률:- 사업주 및 개인은 여러 이질적인 법률 시스템의 복잡성을 보다 효과적이고 효율적으로 다루기 위해 LLM을 사용할 수 있어야 함. *
- 엔지니어링 및 건축: 설계 도구 혹은 시뮬레이션 모델의 강화
- 금융 및 경제 : 예측 모델, 위험 평가 및 알고리즘 거래 시스템의 개선
- 과학적 연구: 실험 시뮬레이션, 분자 상호작용 및 복잡한 데이터 세트 분석을 위한 AI 모델 개선
- 교육 및 훈련 : 교육 콘텐츠의 품질 및 효과성 향상을 위해 AI 주도 학습 플랫폼에 기여
- 환경 과학 및 지속 가능성: 환경 동향 예측, 자원 배분 및 지속 가능한 실천을 증진하기 위한 AI 모델 최적화
토큰 인센티브화 RLHF를 적용한 분야 중 이미 제작 진행 중인 분야가 하나 있는데, 바로 지도(map)입니다. Hivemapper는 운전자뿐만 아니라 매핑 데이터의 편집 및 큐레이팅에 시간을 투자하는 맵 편집자에게도 보상을 지급합니다. Hivemapper의 지도 AI 훈련 툴을 직접 사용하여 체험해 볼 수 있습니다.
영지식 머신러닝(zkML)
블록체인은 현실 세계에서 어떤 일이 일어나고 있는지 모릅니다. 그러나 블록체인이 체인 외부에서 일어나는 사건을 파악하여 실제(IRL) 상황에 기반해서 값을 프로그래밍 방식으로 바꿀 수 있다면 매우 유익할 것입니다. *
- 오라클(Oracle)으로 이 문제의 일부를 해결할 수 있습니다. 그러나 오라클 하나만으로는 역부족입니다. 단순히 실제(IRL) 데이터를 체인에 전달하는 것만으로는 충분하지 않습니다. 체인에 도달하기 이전에 이에 해당하는 수 많은 데이터를 계산해야 합니다. 예를 들어, 보다 높은 수익을 얻기 위해 다양한 풀(pool) 사이에서 예금을 이동해야 하는 수익률 애그리게이터(yield aggregator)를 생각해 봅시다. 신뢰 최소화 방식으로 작업을 수행하려면 애그리게이터는 이용 가능한 모든 풀의 현재 수익률과 위험을 계산해야 합니다. 이는 곧바로 머신러닝(ML)에 적합한 최적화 문제로 바뀌게 됩니다. 하지만 온체인상에서 머신러닝(ML)을 계산하는 데에는 너무 큰 비용이 들기 때문에, 이로써 영지식머신러닝(zkML)에게 기회가 돌아가게 됩니다. *
Modulus Labs와 같은 팀이 현재 이 분야를 구축하고 있습니다. 우리는 Risc Zero와 Lurk와 같은 팀이 많이 생겨 범용 ZKVM을 사용하여 해당 분야를 구축할 것으로 예상합니다.
딥페이크(Deep Fake) 시대의 진본성
딥페이크가 점점 정교해짐에 따라 디지털 미디어 분야에서 진본성과 신뢰가 더욱 중요해지고 있습니다. 해결책 중 하나로 공개키 암호화 기술을 활용하는 방법이 있습니다. 이는 크리에이터가 자신의 콘텐츠에 공개키를 사용해 서명함으로써 그들의 평판을 내걸 수 있게 하는 방법입니다.
그러나 공개 키 자체만으로는 진본성 문제를 해결하기 어렵습니다. 공개키를 실제 신분에 매핑하여 검증 및 신뢰 구축을 할 수 있는 공개 기록이 필요 합니다. 공개키를 인증된 신원에 연결함으로써 딥페이크 이미지 및 동영상에 서명하는 것처럼 누군가가 자신의 키를 남용할 경우 피드백 및 처벌 시스템을 구축할 수 있습니다.
이 시스템을 효과적으로 만들기 위해서는 공개키 서명을 실제 신원 검증과 통합하는 것이 매우 중요합니다. 많은 암호화폐 시스템을 뒷받침하는 블록체인 기술은 탈중앙화된 변조 방지 신원 레지스트리 구축에 중요한 역할을 할 수 있습니다. 이 레지스트리는 공개키를 실제 신원에 매핑하여 보다 용이하게 신뢰를 구축하고 나쁜 행위자에게 책임을 부과할 수 있도록 합니다.
해당하는 레지스트리로써 최소 두 가지 구성이 있는데, 바로 임베디드 하드웨어와 사용자 제어 소프트웨어입니다.
- 임베디드 하드웨어: 스마트폰과 기타 디바이스에서 이미지와 영상 등 기타 미디어에 사용하기 위해 하드웨어 기반의 기본 서명 기능을 곧 도입할 것으로 예상됩니다.
- Solana Labs는 최근 the Saga폰을 출시했습니다. 이 폰은 Solana Mobile Stack (SMS)으로 구동되는 기기입니다. 앞으로 몇 달 안에 모든 사진에 SMSseed vault SDK를 이용해 서명하도록 SMS를 업데이트하여, AI가 생성한 사진이 아님을 증명할 것으로 예상합니다.
- 사용자 제어 소프트웨어: 사용자는 Photoshop, Octane과 같은 디자인 툴과 Stable Diffusion과 같은 이미지 생성기를 사용하여 예술작품을 만들 것입니다. 우리 는 이러한 소프트웨어 프로바이더가 공개키 암호화 매커니즘을 통합하여 크리에이터가 진본성을 입증할 수 있도록 함과 동시에 제작 과정에서 해당 툴의 사용을 인정하게 할 것으로 전망합니다.
결론
결론적으로, 암호화폐와 인공지능 기술의 융합은 여러 산업 분야에 걸친 시급한 과제를 해결하고 혁신적인 해결책을 제시할 기회를 확대합니다. 해당하는 여러 분야의 교차점을 탐색함으로써 AI 학습에서 리소스 할당을 최적화하고, 사람의 피드백을 통해 도메인 특정 강화 학습에 토큰 인센티브를 활용하며, 딥페이크에 직면한 디지털 미디어의 진본성을 유지하기 위한 새로운 방법을 찾을 수 있었습니다.
"그래픽 카드 AirBnB" 모델은 고성능 GPU에 대한 엑세스를 분산 및 민주화하는 잠재력을 제공하여, 보다 많은 개인 및 조직이 AI 연구 개발에 기여할 수 있도록 합니다. 토큰 인센티브화 RLHF는 엔지니어링, 금융, 교육 및 환경 과학에 이르기까지 여러 분야에 적용되어, 도메인 전문가의 지식 활용해 AI 모델을 개선할 수 있습니다. 영지식머신러닝(ZKML)은 체인이 실제 세계의 복잡한 변화에 기반하여 재무 상태를 업데이트할 수 있도록 합니다. 마지막으로, 공개키 암호화를 실제 신원 검증 및 블록체인 기술과 통합함으로써 딥페이크로 인한 문제를 방지하여 디지털 미디어 세계에서 신뢰를 유지할 수 있는 강력한 시스템을 구축할 수 있습니다.
우리는 계속해서 암호화폐와 AI 간의 시너지 효과를 발견해 나가면서 혁신을 주도하고, 가치를 창출하며, 오늘날 우리 사회가 직면한 가장 시급한 문제의 일부를 해결할 수 있는 많은 기회를 발견할 것이라 믿어 의심치 않습니다. 이 두 도메인 간의 교차점을 수용한다면 기술 간의 경계를 무너뜨리고 보다 연결되고 효율적이며 진정성 있는 미래를 만드는 데 도움이 될 것입니다.
암호화폐와 AI의 교차점을 구축하고 계신다면 여기에 나와있는 이용 사례에 관한 구축이 아니더라도 이메일(kyle@multicoin.capital), Telegram, Twitter 혹은 Warpcast을 통해 연락해 주십시오. 언제든지 환영합니다!
Disclosure: Unless otherwise indicated, the views expressed in this post are solely those of the author(s) in their individual capacity and are not the views of Multicoin Capital Management, LLC or its affiliates (together with its affiliates, “Multicoin”). Certain information contained herein may have been obtained from third-party sources, including from portfolio companies of funds managed by Multicoin. Multicoin believes that the information provided is reliable and makes no representations about the enduring accuracy of the information or its appropriateness for a given situation. This post may contain links to third-party websites (“External Websites”). The existence of any such link does not constitute an endorsement of such websites, the content of the websites, or the operators of the websites.These links are provided solely as a convenience to you and not as an endorsement by us of the content on such External Websites. The content of such External Websites is developed and provided by others and Multicoin takes no responsibility for any content therein. Charts and graphs provided within are for informational purposes solely and should not be relied upon when making any investment decision. Any projections, estimates, forecasts, targets, prospects, and/or opinions expressed in this blog are subject to change without notice and may differ or be contrary to opinions expressed by others.
The content is provided for informational purposes only, and should not be relied upon as the basis for an investment decision, and is not, and should not be assumed to be, complete. The contents herein are not to be construed as legal, business, or tax advice. You should consult your own advisors for those matters. References to any securities or digital assets are for illustrative purposes only, and do not constitute an investment recommendation or offer to provide investment advisory services. Any investments or portfolio companies mentioned, referred to, or described are not representative of all investments in vehicles managed by Multicoin, and there can be no assurance that the investments will be profitable or that other investments made in the future will have similar characteristics or results. A list of investments made by funds managed by Multicoin is available here: https://multicoin.capital/portfolio/. Excluded from this list are investments that have not yet been announced (1) for strategic reasons (e.g., undisclosed positions in publicly traded digital assets) or (2) due to coordination with the development team or issuer on the timing and nature of public disclosure.
This blog does not constitute investment advice or an offer to sell or a solicitation of an offer to purchase any limited partner interests in any investment vehicle managed by Multicoin. An offer or solicitation of an investment in any Multicoin investment vehicle will only be made pursuant to an offering memorandum, limited partnership agreement and subscription documents, and only the information in such documents should be relied upon when making a decision to invest.
Past performance does not guarantee future results. There can be no guarantee that any Multicoin investment vehicle’s investment objectives will be achieved, and the investment results may vary substantially from year to year or even from month to month. As a result, an investor could lose all or a substantial amount of its investment. Investments or products referenced in this blog may not be suitable for you or any other party.
Multicoin has established, maintains and enforces written policies and procedures reasonably designed to identify and effectively manage conflicts of interest related to its investment activities. For more important disclosures, please see the Disclosures and Terms of Use available at https://multicoin.capital/disclosures and https://multicoin.capital/terms.