프로젝트 소개

Happy World by Happy Words, HAPPY 😊

Untitled

HAPPY: HAte sPeech Purification for You 는 사용자의 댓글이 악성 댓글인지 판별하고, 이를 순화한 문장을 생성하여 제시하는 서비스입니다.

👉 Demo

Background

모두가 행복하게 의견을 교류할 수 있도록

사용자의 의견에서 혐오만 제거하고 공유할 수 있도록 합니다.

🤔 온라인 공간에서의 혐오 표현은 꾸준히 사회적 문제로 거론되어 왔습니다. 대규모 포털 사이트 네이버는 혐오 표현의 사회적 영향력을 고려, 특정 인물에 대해 과도하게 공격적인 의견이 오갈 수 있는 연예 및 스포츠 뉴스의 댓글 서비스 자체를 종료했습니다. 하지만, 악플은 결국 사라지지 않고 여전히 다른 곳에서 생산되고 있습니다.

🤔 기존의 필터링 서비스는, 댓글 자체를 가리거나, 댓글의 특정 부분만을 가리는 식으로 사용되고 있습니다. 그러나 댓글을 가리는 방식은, 해당 사용자의 의견을 반영하기 어렵다는 한계를 가집니다. 또한 일부 혐오 의미를 담은 단어만을 가리는 방식도 편견이나 비꼬는 말투를 검출할 수 없다는 한계를 가집니다.

💡 저희는 필터링을 댓글 등록 전에 적용합니다. 사용자에게 해당 댓글이 필터링 될 수 있다고 경고하면서 어느 부분이 문제가 되는지를 알려줍니다. 그리고 어떤 방식으로 순화하여 작성하면 좋을 지에 대한 방법을 제시합니다. 이를 통해 온라인 공간에서 사람들이 보다 기분 좋게 의견을 교환하기를 바랍니다.

학술적으로도 우리의 Contribution은 이어지니까

욕설이 포함되어 데이터셋 구축 과정에서 버려지는 문장들을 순화하여 사용할 수 있도록 합니다.

🤔 데이터셋 구축 과정에서, 상당수의 문장들이 욕설을 포함하고 있다는 윤리적 이슈로 인해, 댓글에 담긴 의견과 관계없이 버려지게 됩니다.

💡 욕설과 혐오 표현이 포함되어 데이터셋 구축 과정에서 사용하지 못했던 문장들을 순화함으로써, 해당 문장들에 담긴 다양한 의견을 윤리적 문제 없이 반영하는 데이터셋을 구축할 수 있도록 합니다.

Service Architecture

Untitled

🤔 단시간에 여러 요청이 들어오면, 이를 효율적으로 처리할 필요가 있습니다. Classification의 경우 모든 댓글에 대해 수행해야 하는 작업입니다. Generation은 classification에서 혐오 문장으로 분류된 경우에만 수행하지만, generation model은 classification model에 비해 추론 속도가 매우 느립니다.

💡 Classification의 경우, BentoML으로 빠르게 batch serving을 수행합니다. Generation의 경우, routing으로 여러 서버를 동시 운영하며 트래픽을 분산시킵니다.