RadarURL

웹서버,WAS
2014.04.11 18:07

robots.txt 파일(로봇배제 표준)

조회 수 2091 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

로봇배제 표준이란?
구글등 검색 로봇이 정보수집을 위해 사이트를 방문할 경우를 대비하여, 검색로봇에 대한 웹사이트의 디렉토리 및 파일 들에 대한 검색조건을 명시해 놓은 국제 규약이다.

• 정상적인 검색로봇은 사이트 방문시 가장 먼저 웹사이트의 로봇배제 표준파일(robots.txt)를 확인하고, 파일에 명시된 사항을 준수하면서 웹사이트의 컨텐츠를 수집한다.
• robots.txt 화일에는 최소한 한개의 Disallow 필드(field)가 있어야 한다.

로봇 배제 표준은 방지기술이 아닌 사이트 및 검색로봇 운영자간의 단순한 약속(규약)이므로 악의적인 로봇이 로봇 배제 표준을 무시하고 사이트의 컨텐츠를 수집할 수 도 있다.

robots.txt의 내용은 다음과 같은 의미로 사용된다.

User-agent: *은 모든 User-agent이고,
특정 user-agent를 지정할 경우 해당 로봇 이름을 지정
Allow or Disallow: disallow에서
/은 모든 하위 문서에 대해 배재를 의미하고,
아무것도 지정하지 않으면 허가를 의미

/arirang/는 arirang 디렉토리만,
/arirang은 arirang 디렉토리와 그 디렉토리내의 파일이 적용대상임

노출 허용/금지 의도 robots.txt 타이틀 robots.txt 내용
홈페이지 전체 내용을 모든 검색엔진에 노출을 허용 User-agent: *
Disallow:
홈페이지 전체 내용을 모든 검색엔진에 노출을 방지 User-agent: *
Disallow: /
홈페이지 디렉토리가 information인 것에 대한 노출을 방지 User-agent: *
Disallow: /information/
특정 검색엔진(abcbot)의 접근만을 거부 User-agent: abcbot
Disallow: /
User-agent: *
Disallow:
특정 검색엔진(abcbot)의 접근만을 허용 User-agent: abcbot
Disallow:
User-agent: *
Disallow: /
모든 검색엔젠에 대해 /directory/a.html의 접근을 거부 User-agent: *
Disallow: /directory/a.html
홈페이지의 디렉토리가 information인 것에 대한 노출을 허가 User-agent: *
Disallow: /information/
홈페이지의 디렉토리 또는 파일명이 information인 것에 대한 접근을 허가 User-agent: *
Disallow: /information

【예제】
# pwd
/export/home/apache2/htdocs
# ls
favicon.ico     index.html      left.html       right.html      sounds
images          lecture         netsarang.html  robots.txt
# cat robots.txt
user-agent:*
disallow:
#


http://www.robotstxt.org/ 참조

 

출처 : http://radiocom.kunsan.ac.kr/lecture/home_page/robots_txt.html

?

공부 게시판

공부에 도움되는 글을 올려주세요.

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 [공지] 공부 게시판 입니다. 처누 2003.08.18 952957
17 유닉스/리눅스 리눅스(Linux)에서 하위 디렉토리까지 파일 찾기, 찾아서 지우기 YooN 2015.02.24 1698
16 데이터베이스 MySQL 로그 파일 관리 2 - 로그 파일 남기기 YooN 2014.11.17 2025
15 데이터베이스 MySQL 로그 파일 관리 1 - 설정 YooN 2014.11.17 1929
14 데이터베이스 Mysql 데이터 폴더의 mysql-bin.xxx 파일들 관련 삭제 및 초기화 방법 YooN 2014.11.17 1817
13 윈도우즈 Windows 7에서 thumbs.db 파일이 생성되지 않도록 설정하기 file YooN 2014.11.09 1811
12 윈도우즈 Microsoft Windows 업데이트 항목 중 'KB2949927'파일 설치 후 발생하는 오류현상 해결 YooN 2014.10.24 2631
11 유닉스/리눅스 윈도우7 (winSxS폴더 등)불필요한 파일 정리하여 용량확보하기 file YooN 2014.10.24 2919
10 유닉스/리눅스 삭제된 파일 복구 프로그램 베스트 R-Studio 사용법 YooN 2014.07.26 2747
9 유닉스/리눅스 Linux 디렉토리나 파일 개수 세기 YooN 2014.07.08 2289
8 데이터베이스 MySQL my.cnf 파일 수정으로 mysql 서버 튜닝하기 YooN 2014.07.07 2665
7 웹서버,WAS Apache 서버에서 확장자 .htm 파일 내의 php 코드가 실행되지 않는 문제 해결 방법 YooN 2014.05.26 3063
6 유닉스/리눅스 리눅스 파일의 소유자, 소유그룹 변경하기 YooN 2014.05.26 2489
5 웹 프로그래밍 php 웹사이트에서 파일을 업로드 하는중 100%에서 멈춰버리는 현상 해결 YooN 2014.05.16 3381
4 유닉스/리눅스 touch (파일의 날짜시간정보를 변경) YooN 2014.04.29 2137
» 웹서버,WAS robots.txt 파일(로봇배제 표준) YooN 2014.04.11 2091
2 윈도우즈 도스에서 시스템 출력 리디렉션. (화면과 파일로 동시 출력) YooN 2013.08.27 4803
1 소프트웨어 확장자가 UIF인 파일들 YooN 2012.07.23 6488
Board Pagination Prev 1 Next
/ 1


즐겨찾기 (가족)

JAESOO's HOMEPAGE


장여은 홈페이지


장여희 홈페이지


장여원 홈페이지


즐겨찾기 (업무)

알리카페 홀릭

숭실대 컴퓨터 통신연구실 (서창진)

말레이시아 KL Sentral 한국인 GuestHouse


즐겨찾기 (취미)

어드민아이디

유에코 사랑회

아스가르드 좋은사람/나쁜사람

JServer.kr

제이서버 메타블로그

재수 티스토리


즐겨찾기 (강의, 커뮤니티)

재수 강의 홈페이지


한소리


VTMODE.COM


숭실대 인공지능학과


숭실대 통신연구실


베너