RadarURL

웹서버,WAS
2014.04.11 18:07

robots.txt 파일(로봇배제 표준)

조회 수 1378 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

로봇배제 표준이란?
구글등 검색 로봇이 정보수집을 위해 사이트를 방문할 경우를 대비하여, 검색로봇에 대한 웹사이트의 디렉토리 및 파일 들에 대한 검색조건을 명시해 놓은 국제 규약이다.

• 정상적인 검색로봇은 사이트 방문시 가장 먼저 웹사이트의 로봇배제 표준파일(robots.txt)를 확인하고, 파일에 명시된 사항을 준수하면서 웹사이트의 컨텐츠를 수집한다.
• robots.txt 화일에는 최소한 한개의 Disallow 필드(field)가 있어야 한다.

로봇 배제 표준은 방지기술이 아닌 사이트 및 검색로봇 운영자간의 단순한 약속(규약)이므로 악의적인 로봇이 로봇 배제 표준을 무시하고 사이트의 컨텐츠를 수집할 수 도 있다.

robots.txt의 내용은 다음과 같은 의미로 사용된다.

User-agent: *은 모든 User-agent이고,
특정 user-agent를 지정할 경우 해당 로봇 이름을 지정
Allow or Disallow: disallow에서
/은 모든 하위 문서에 대해 배재를 의미하고,
아무것도 지정하지 않으면 허가를 의미

/arirang/는 arirang 디렉토리만,
/arirang은 arirang 디렉토리와 그 디렉토리내의 파일이 적용대상임

노출 허용/금지 의도 robots.txt 타이틀 robots.txt 내용
홈페이지 전체 내용을 모든 검색엔진에 노출을 허용 User-agent: *
Disallow:
홈페이지 전체 내용을 모든 검색엔진에 노출을 방지 User-agent: *
Disallow: /
홈페이지 디렉토리가 information인 것에 대한 노출을 방지 User-agent: *
Disallow: /information/
특정 검색엔진(abcbot)의 접근만을 거부 User-agent: abcbot
Disallow: /
User-agent: *
Disallow:
특정 검색엔진(abcbot)의 접근만을 허용 User-agent: abcbot
Disallow:
User-agent: *
Disallow: /
모든 검색엔젠에 대해 /directory/a.html의 접근을 거부 User-agent: *
Disallow: /directory/a.html
홈페이지의 디렉토리가 information인 것에 대한 노출을 허가 User-agent: *
Disallow: /information/
홈페이지의 디렉토리 또는 파일명이 information인 것에 대한 접근을 허가 User-agent: *
Disallow: /information

【예제】
# pwd
/export/home/apache2/htdocs
# ls
favicon.ico     index.html      left.html       right.html      sounds
images          lecture         netsarang.html  robots.txt
# cat robots.txt
user-agent:*
disallow:
#


http://www.robotstxt.org/ 참조

 

출처 : http://radiocom.kunsan.ac.kr/lecture/home_page/robots_txt.html

?

공부 게시판

공부에 도움되는 글을 올려주세요.

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 [공지] 공부 게시판 입니다. 처누 2003.08.18 927906
1746 응용 프로그래밍 Spring MVC 에서 ContentNegotiatingViewResolver를 이용한 단일 RequestMapping 으로 Muilti-View 처리하기 file JaeSoo 2014.05.09 1687
1745 응용 프로그래밍 Struts와 Spring의 Controller 의 차이는? JaeSoo 2014.05.09 1259
1744 응용 프로그래밍 Spring MVC file JaeSoo 2014.05.09 1591
1743 응용 프로그래밍 올바른 자바 프레임워크 선택하기 JaeSoo 2014.05.09 1400
1742 응용 프로그래밍 스프링 프레임워크(Spring Framework) 버전(version) 확인하기 JaeSoo 2014.05.09 2134
1741 응용 프로그래밍 스트러츠와 스프링의 비교 JaeSoo 2014.05.09 1148
1740 웹서버,WAS Apache Struts 버전 확인 방법 JaeSoo 2014.05.09 1998
1739 윈도우즈 Chkdsk.exe에서 사용할 수 있는 새로운 /C 및 /I 스위치에 대한 설명 JaeSoo 2014.05.08 1531
1738 웹 프로그래밍 PHP MySQL 명령어 실행 함수 mysql_query JaeSoo 2014.04.29 1669
1737 데이터베이스 mariadb 원격 접속 허용 JaeSoo 2014.04.29 1477
1736 유닉스/리눅스 vsftp root로 접속하기 JaeSoo 2014.04.29 1491
1735 유닉스/리눅스 touch (파일의 날짜시간정보를 변경) JaeSoo 2014.04.29 1445
1734 데이터베이스 오라클 업데이트, 딜리트 쿼리 (oracle update, delete query) JaeSoo 2014.04.19 2031
1733 웹 프로그래밍 제로보드 XE에서 무분별한 스팸글 등록으로부터 임시 해결 팁 JaeSoo 2014.04.19 2088
1732 업무 회사 조직 영문표기(Organizational Chart) JaeSoo 2014.04.16 1694
1731 업무 입찰기초 공부하기 (입찰 안내서) - 입찰준비 과정, 참가등록 방법, 공동도급 관련 내용 등 file JaeSoo 2014.04.14 1748
1730 윈도우즈 Windows 7에서 자동 로그인 설정하기 file JaeSoo 2014.04.12 1686
1729 웹 프로그래밍 자주 발생하는 소켓 에러(Socket Error) JaeSoo 2014.04.11 3903
1728 웹서버,WAS robots.txt를 현명하게 사용하는 방법 JaeSoo 2014.04.11 1481
» 웹서버,WAS robots.txt 파일(로봇배제 표준) JaeSoo 2014.04.11 1378
Board Pagination Prev 1 ... 32 33 34 35 36 37 38 39 40 41 ... 124 Next
/ 124


즐겨찾기 (가족)

JAESOO's HOMEPAGE


YOUNGAE's HOMEPAGE


장여은 홈페이지


장여희 홈페이지


장여원 홈페이지


즐겨찾기 (업무)

알리카페 홀릭

숭실대 컴퓨터 통신연구실 (서창진)

말레이시아 KL Sentral 한국인 GuestHouse


즐겨찾기 (취미)

어드민아이디

유에코 사랑회

아스가르드 좋은사람/나쁜사람

JServer.kr

제이서버 메타블로그

재수 티스토리


즐겨찾기 (강의, 커뮤니티)

재수 강의 홈페이지


한소리


VTMODE.COM


숭실대 인공지능학과


숭실대 통신연구실


베너