블로그 운영/티스토리

유사문서 기준은 무엇이고 , 유사문서를 피하는 방법

Oliviamy 2023. 6. 27.
반응형
 
 

유사문서나 다른 글을 그대로 가져오는 경우 블로그는 점점 저품질 블로그로 낙인찍히게 되면서 웹사이트 노출순위가 더욱더 뒤로 밀려나게 되어서 , 소위 '나락'가게 된다고 하지요. 블로그 글과 콘텐츠 작성 시 유사문서나 중복문서의 기준을 알고 이를 잘 이용하신다면 , 좀 더 효율적인 블로그 운영이 되실 수 있을 것입니다. 유사문서에 대한 정의를 명확히 알고 있다면 이를 잘 피해 가신다면 유사문서를 회피할 수 있겠습니다.

 

 

질문 1) 유사문서 기준이 무엇인가요?

유사문서라는 게 무엇일지 우선 명확히 알고 있을 필요가 있습니다. 본문 내용의 소주제나 맥락, 단락내용이 비슷하면 유사문서로 인정이 되는지 궁금하실 수 있는데요. 그대로 붙이는 경우는 당연히 유사문서로 판별받게 됩니다. 이외에도 어떤 기준에 위반되는 경우에 유사문서로 판별을 받게 될까요?

블로그_유사문서

텍스트 문서들의 유의성을 판단하고 비교하는 방법이 대표적인데요. 이는 다양한 방법과 알고리즘을 바탕으로 판단하게 된다고 합니다. 단어 빈도성과 유사성을 측정하는데 있어서 몇 가지 기반을 가지고  판독하게 되는데요. 아래 몇 가지 기반을 바탕으로 추정할 수 있습니다.

 

단어기반

 

기본적으로 단어기반 유사성을 보게 되는데 , 여기서는 문서에 있는 공통 단어나 단어들의 등장 빈도, 횟수를 바탕으로 유사성을 측정하게 됩니다. 이는  Term Frequency등의 계산으로 빈도성과 유사성을 측정할 수 있습니다.

 

문장기반

 

문장기반 유사성이란 문장구조 또는 문법적인 측면구조까지 파악하여 유사성을 평가하게 됩니다. 문장 구조나 문장의 특정 패턴을 분석하여 탐지한다고 하니 이러한 정도의 유사문서 추정이라면 , '복사하여 붙여 넣기'가 아니더라도 다른 자료를 바탕으로 유사문서를 생성해 낸다면 , 판별을 피해 가기가 쉽지 않을 것 같습니다. 

 

토픽 모델링 기반

토픽모델링 기반 유사문서 확인 작업은 문서의 주제 와 토픽들을 추출하여 비교하는 방법으로 토픽 모델링 알고리즘 사용으로 문서 주제 분포를 파악, 주제 분포 간 유사도를 비교하여서 유사성을 측정하게 됩니다.

 

질문 2) 유사문서 해당 행위는 어떤 것이 있을까요?

첫째, 카페나 다른 사이트에서 올린 이미지를 그대로 사용하는 행위 그리고 작성한 글을 그대로 가져와서 인용하는 행위

둘째, 저품질 블로그나 다른 블로그에 올렸던 글을 삭제 후 다른 새 블로그에 업로드하는 행위

셋째 , 책내용 또는 인터넷 기사 뉴스 등을 그대로 블로그에 올리는 행위

넷째, 정부 정책이나 정치적 이슈에 관해서 비방이나 폄하 등의 글을 올리는 행위

다섯 번째 , 사진의 메타정보 수정을 하여서 정보만 바꾸고 계속 재사용하는 행위

여섯 번째 ,  업체에서 광고성으로 제공한 상품 리뷰 사진 및 내용을 그대로 블로그에 올리는 행위

일곱 번째 , 내 콘텐츠 글이 다른 사이트에서도 동일하게 업로드되는 경우

이미지 관련해서 블로그 업로드시 참고할 만한 내용은 아래글을 참고해서 읽어 보시면 좋습니다. 가장 이미지를 사용하실 때 좋은 것은 픽사베이 무료이미지 같은 것으로 다운로드하셔서 , 메타정보를 지우시고 , 압축하여서 용량을 가볍게 하신 후, webp 파일 같은 것으로 최소화시킨 후에  사용하시는 것을 추천드립니다.

 

블로그 이미지 어떻게 할까? 바로가기

 

질문 3) 유사문서 피하는 방법

우선은 정보를 얻는 것에는 여러 가지가 있습니다. 첫째로 유튜브를 통해서 정보를 얻는 방법이 있는데요. 유튜브의 관련 내용을 스크립트를 다운로드하셔서 한번 쭉 읽어 보시거나, 시간적 여유가 되신다면 유튜브를 시청해서 정보를 습득하실 수 있습니다.

둘째로는 관련 검색 키워드의 상위노출 블로그를 찾아보시는 방법을 활용하실 수 있습니다. 잘은 모르는 분야이지만, 상위노출 문서 두어 개 정도 읽어 보신다면 충분히 글을 쓰실 만큼의 정보를 획득하실 수 있는데요. 이를 내 것으로 활용하는 방법입니다.

셋째로는 영문검색으로 해외사이트들의 관련 정보를 찾으시는 방법입니다. 당연히 영어기반으로 작성된 자료들을 한번 번역하여서 , 나만의 언어로 바꾸어 주는 방법이 있습니다. 그런 과정에서 물론 충분히 내용을 숙지하시고 글을 써내려 가신다면 이는 절대 유사문서로 저품질 블로그가 되지는 않겠지요?

 

 

핵심 키워드 잘 넣자

유사문서로 분류되지 않기 위해서 정보를 얻는 방법은 설명을 드렸습니다. 이제 정보를 각색하여서 나만의 언어로 정리를 하는 경우 유의하여야 할 점은 관련 주제의 키워드들을 몇 가지 잘 추려 내어서 이를 중심으로 단락을 나누어서 작성하시느느 방법이 중요합니다. 각각의 소단락 에는 소주제들을 잘 나타내는 단어들을 적절히 섞어서 넣어 주신다면 , 새로운 괜찮은 콘텐츠를 만들어 내실 수 있습니다. 키워드를 잘 찾는 방법은 아래 블로그 운영 가이드를 참고하셔서 읽어 보신다면 많은 도움이 되실 수 있습니다.

이외에도 간결하고 쉽게 블로그 콘텐츠를 창출해 내는 방법과 인사이트를 얻는 방법은 여러 가지가 있을 수 있습니다. 이는 다음 아래 글들을 참고하셔도 좋을 것 같습니다. 이상으로 유사문서 기준과 유사문서 피하는 방법에 대한 내용을 간략히 정리해 보았습니다. 블로그 생활에 도움이 되시면 좋겠습니다.

 ◈ 함께 읽으면 좋은 블로그 운영 가이드

[블로그 운영] - 블로그 체류시간 늘리는 방법 6가지 공유드립니다.

 

블로그 체류시간 늘리는 방법 6가지 공유 드립니다.

오늘은 블로그 체류시간 늘리는 비법에 대해서 알려 드려 보겠습니다. 블로그가 상위노출이 될 수 있는 방법에는 여러 가지 원인과 요건이 있겠지만, 그중에서 하나로 중요한 원인을 차지하는

knowledge.cat-dreaminvestment.com

[블로그 운영/블로그 고급설정] - 블로그 1분 만에 , 키워드만으로 SEO최적화 글 정말 되네?

 

블로그 1분만에 , 키워드만으로 SEO최적화 글 정말 되네?

블로그 자동 글쓰기는 여러가지 있습니다. 여기서는 두번째 프롬프트 를 공유해 드리도록 하겠습니다. AIPRM 확장프로그램 200% 글쓰기 어떻게 블로그글 1분만에 SEO최적화 글을 써내려갈수 있을까

knowledge.cat-dreaminvestment.com

[블로그 운영/블로그 고급설정] - 고단가 키워드 찾는 방법 | 키워드 시터 및 구글애즈 활용 4단계 비밀

 

고단가 키워드 찾는 방법 | 키워드 시터 및 구글애즈 활용 4단계 비밀

오늘은 고단가 키워드 찾는 방법에 대해서 , 자기가 생각한 주제나 콘텐츠 내에서 찾아보는 방법에 대해서 정리해 보도록 하겠습니다. 이는 내가 생각해낸 주제나 쓰려고 하는 카테고리 안에서

knowledge.cat-dreaminvestment.com

 

반응형

댓글

💲 추천 글