본문 바로가기

say와 AI 챗봇친구 만들기 보고서

세계 최초 다크웹 AI, DarkBERT를 만든 사람들 (Korean sub)

728x90
반응형
SMALL

세계 최초 다크웹 AI, DarkBERT를 만든 사람들 (Korean sub)

 

[공지사항] 세계 최초 다크웹 AI, DarkBERT를 만든 사람들

 
🌎 Notice: 4-minute interview of S2W's AI team for Korean. English subtitles for the video are prepared separately. 👉 English subtitles
 
 
 
 
 
해당 영상은 S2W의 DarkBERT 연구 논문 및 개발의 주역인 AI팀 정진우, 장우진, 최건, 이용재 연구원을 인터뷰이로 모시고 진행하였습니다. 보다 자세한 내용은 아래 Full story 영상을 통해 확인 가능하십니다.
[타임라인] 00:09 해외 IT, AI, 사이버보안 미디어에서 다루어지고 있는 ‘DarkBERT’. 무엇인가요?
 
01:22 NAACL 2022, ACL 2023은 무엇인가요?
01:50 ChatGPT의 신뢰성에 대해 어떻게 생각하시나요?
02:43 ChatGPT와 비교해서 볼 때 DarkBERT를 어떻게 활용할 수 있을까요?

 

S2W의 DarkBERT 연구 및 개발의 주역인 AI팀 정진우, 장우진, 최건, 이용재 연구원을 인터뷰이로 모시고 진행한 인터뷰 영상이 라이브 되었습니다. 

 

[영상 타임라인]

질문 1) 해외 IT, AI, 사이버보안 미디어에서 다루어지고 있는 ‘DarkBERT’. 무엇인가요?

질문 2) NAACL 2022, ACL 2023은 무엇인가요?

질문 3) ChatGPT의 신뢰성에 대해 어떻게 생각하시나요?

질문 4) ChatGPT와 비교해서 볼 때 DarkBERT를 어떻게 활용할 수 있을까요?

 

해당 영상은 국, 영, 일문으로 번역되어 있으며 보다 자세한 내용이 궁금하신 분들께서는 S2W 공식 유튜브 채널에 방문해 full story 영상을 확인해 보세요! 

 

☑️ Click here to watch videos. 

[보고서] DarkBERT에 대한 심층 이해 Part 2

 

DarkBERT에 대한 심층 이해를 돕기위해 S2W에서 블로그 시리즈를 준비했습니다. 

 

오늘은 그 두 번째로 Part 2를 소개합니다.

 

S2W는 마약 밀매부터 암호화폐, 랜섬웨어 등의 하이테크 기반의 범죄에 이르기까지 다양한 위협과 관련된 공공 및 민간 기관을 위한 데이터 인텔리전스 플랫폼 서비스를 제공해 왔습니다. S2W의 고객들은 숨겨진 데이터 소스에서 수집한 다양한 데이터로 분석 및 제공된 S2W의 솔루션을 활용하여 실행 가능한 인텔리전스(Actionable Intelligecne)를 도출해 내고 있습니다. 

 

아래 이미지는 S2W가 다양한 데이터 소스에서 수집한 데이터를 S2W 솔루션에서 쉽게 사용할 수 있게 만든 방식을 보여 줍니다. 이미지에 표시된 각 구성 요소는 완전한 위협 인텔리전스 생산 과정을 수립하는 데 중요하며, 따라서 모두 In-house 방식으로 개발 및 유지되고 있습니다. 이러한 시스템을 운영함으로써 S2W는 직접, 최신 인텔리전스를 고객사에게 제공할 수 있습니다. 😈

 

이와 같이 확장 가능한 데이터 수집 플랫폼을 가지고 있기 때문에, 매일 방대한 양의 데이터를 처리하고 있습니다. 모든 수집 데이터에 대해 S2W 위협 데이터 웨어하우스는 다양한 위협 분석 워크플로우를 적용하여 정보를 추출, 연관시키고 풍부하게 합니다. 

 

위협 탐지(Threat Detection)를 위한 DarkBERT의 이야기를 보다 구체적으로 만나보기 원하시나요? S2W의 분석가가 직접 운영하는 미디엄 블로그를 만나보시죠!

 

☑️ Click here to learn more.

DarkBERT 소개: AI로 대규모 사이버 범죄 퇴치

DarkBERT: 인터넷의 어두운 면을 위한 언어 모델

S2W는 마약 밀매와 같은 전통적인 범죄부터 암호화폐 및 랜섬웨어와 관련된 하이테크 범죄에 이르기까지 다양한 위협을 다루는 공공 및 민간 기업에 서비스로 특수 목적 데이터 인텔리전스 플랫폼을 자랑스럽게 제공하고 있습니다. 우리 고객은 실행 가능한 인텔리전스를 도출하기 위해 의도적으로 숨겨진 데이터 소스에서 수집한 광범위한 데이터가 로드된 플랫폼을 활용하고 있습니다.

이 그림은 다양한 데이터 소스에서 수집한 데이터를 분석 플랫폼에서 쉽게 사용할 수 있게 만든 방법을 대략적으로 보여줍니다. 그림에 표시된 모든 구성 요소는 완전한 위협 인텔리전스 생산 프로세스를 설정하는 데 중요하므로 모두 사내에서 개발 및 유지 관리되었습니다. 이러한 시스템을 자체적으로 운영하여 자체 생산하여 고객에게 신선한 정보를 직접 전달할 수 있게 되었습니다(농장 직배송!).

이러한 확장 가능한 데이터 수집 플랫폼을 가지고 우리는 매일 방대한 양의 데이터를 처리해 왔습니다. 들어오는 모든 데이터에 대해 당사의 위협 데이터 웨어하우스는 다양한 위협 분석 워크플로를 적용하여 정보를 추출, 연관 및 강화합니다. 예를 들어 워크플로 중 하나는 모든 웹 데이터를 분석하고 유사한 웹 사이트의 클러스터로 분류합니다. 워크플로에서 생성된 이 새로운 유형의 정보는 고급 검색 필터, 피싱 웹사이트 탐지( The Web Conf 2019 ) 등과 같은 다양한 기능을 잠금 해제합니다. 또한 추출된 정보를 암호화폐 메타데이터 및 트랜잭션으로 강화하여 고객이 상호 연관시킬 수 있도록 하는 또 다른 워크플로가 있습니다. 암호화폐 전송과 관련된 사이버 범죄를 조사합니다( NDSS 2019 ).

그러나 워크플로의 작업을 완료하려면 위협 분석가의 도메인 지식이나 통찰력이 필요합니다. 이러한 작업을 자동화하고 확장성 문제를 제거할 수 있습니까? 여기서 AI가 등장합니다.

DarkBERT와 그 이상

당사는 창립 이래 이 특별한 목적의 AI 연구에 많은 노력을 기울였으며, DarkBERT는 최상위 컨퍼런스에서 출판이 승인된 두 번째 AI/NLP 연구 논문입니다. (참고로 저희 사이버 범죄 수사 플랫폼인 XARVIS에 구축된 위협 주제 분류 모델을 소개한 첫 번째 논문 입니다.)

오늘날 사용 가능한 인기 있는 범용 AI 모델(예: chatGPT)과 달리 DarkBERT는 사이버 범죄 분야에서 잘 작동하도록 특별히 훈련되고 조정된 특수 목적 AI 모델입니다. DarkBERT는 Ask-Me-Anything이라기보다는 사이버 범죄 분야에서 수년간의 경험을 가진 전문 분석가에 가깝습니다. 우리 회사에 이러한 특수 에이전트가 있으면 우리가 생산하는 인텔리전스의 품질은 물론 전반적인 생산성과 효율성이 크게 향상될 것입니다. DarkBERT의 성능과 효과가 공식적으로 동료 검토를 받았기 때문에 이제 우리가 그것을 어떻게 활용하느냐의 문제입니다.

우리는 이미 DarkBERT를 기반으로 다양한 응용 프로그램 개발을 시작했으며 사용 사례 중 하나를 소개하려고 합니다.

위협 탐지를 위한 DarkBERT

위협 탐지는 사이버 범죄 및 사이버 위협 인텔리전스 분야에서 가장 중요한 프로세스로 위협 탐지가 조기에 발생할 수 있으므로 조직이 더 빨리 대응하여 피해를 최소화할 수 있습니다. 그 중요성을 이해하고 있음에도 불구하고 많은 조직은 위협 탐지가 근본적으로 복잡하고 어려운 작업이기 때문에 어려움을 겪고 있습니다. 사이버 범죄자는 눈치채지 못한 채 궁극적으로 목표를 달성하기 위해 신기술을 적극적으로 활용하는 최초의 어댑터이기 때문에 새로운 전술이나 수법을 신속하게 식별하고 대응하기 어려울 것입니다.

우리의 위협 분석 플랫폼은 위에서 언급한 대부분의 문제를 해결하여 위협 탐지를 가능하게 하지만, 우리는 플랫폼을 사용하는 조직이 자체 위협 분석가 팀이 있고 다음과 같은 우려:

  • 자체 보안 팀이 없는 소기업이 여전히 위협 탐지를 수행할 수 있습니까?
  • 기업이 확장하고 엄청난 양과 복잡성의 보안 위협에 직면함에 따라 점점 더 많은 위협 분석가를 고용해야 합니까?

앞서 언급한 DarkBERT는 잘 훈련된 사이버 범죄 분석가를 구축하는 핵심 AI 엔진이 될 수 있습니다. 그러한 AI 분석가가 위협 분석 플랫폼에서 추출한 정보를 이해하고 분석하여 인간 분석가를 지원하거나 대체할 수 있다면 확장성 및 비용 문제를 제거할 수 있습니다.

우리는 현재 다음과 같은 답변을 위해 데이터를 자율적으로 분석하는 AI 사이버 범죄 분석가를 구축하고 테스트하고 있습니다.

  • 데이터에 위협이 될 수 있는 정보가 포함되어 있습니까?
  • 어떤 유형의 위협입니까?
  • 그렇다면 잠재적인 대상/피해자는 누구입니까?
  • 배우는 누구입니까?
  • 어떤 정보가 다른 정보보다 더 중요합니까?

다음 그림은 데이터 유출을 처리하기 위해 특별히 제작된 DarkBERT 애플리케이션의 스크린샷입니다. 위의 질문에 답하고 사용자가 알아야 할 긴급한 데이터 위반을 권장하도록 설계되었습니다. 이 예에서는 미국 공공 부문의 데이터 침해를 탐지하도록 애플리케이션을 구성했습니다.

이 블로그 게시물에 간략하게 소개된 사용 사례 외에도 여러 연구 프로젝트가 진행 중입니다. 사이버 범죄자와 소통하여 인간 에이전트를 대신하여 능동적인 수사를 수행할 수 있는 비밀 챗봇, 잠재적 위협을 확률적으로 예측할 수 있는 사이버 범죄 추론 엔진 등

728x90
반응형
LIST