main.yml

# Playbook based on https://fr.blog.businessdecision.com/tutoriel-cluster-hadoop/

- debug:
    msg:
      - "Hadoop only support java jdk 8, see https://cwiki.apache.org/confluence/display/HADOOP/Hadoop+Java+Versions when it'll support jdk 11"
      - "Be aware that things may not work when using jdk 11 like explore HDFS using webserver on port 9870"
      - "Default IPv4 address is : {{ ansible_default_ipv4.address }}"

- name: Set java home as environment variable
  become: yes
  apt:
    name:
      #- openjdk-11-jdk #HDFS does support only java 8...
      - openjdk-8-jdk

- name: create hadoop group
  become: yes
  group:
    name: hadoop

- name: create hadoop user
  become: yes
  user:
    name: hadoop
    group: hadoop
    home: "{{ hadoopUSRHome }}"
    createhome: yes
    system: yes

- name: Set JAVA_HOME as environment variable
  become: yes
  become_user : hadoop
  blockinfile:
    insertafter: EOF
    path : ~/.bashrc
    block: |
      export JAVA_HOME={{ javahome }}
      export HADOOP_HOME=/usr/local/hadoop
      export PATH=$PATH:$HADOOP_HOME/bin

- name: source .bashrc
  become: yes
  become_user: hadoop
  shell: source ~/.bashrc
  args:
     executable: /bin/bash


- name: create .ssh directory
  become: yes
  file:
    path: "{{ hadoopUSRHome }}/.ssh/"
    state: directory
    owner: hadoop
    group: hadoop
    mode: 0700

- name: copy ssh key
  become: yes
  copy:
    src: "{{ item }}"
    dest: "{{ hadoopUSRHome }}/.ssh/"
    owner: hadoop
    group: hadoop
    mode: 0600
  with_items:
    - keys/id_rsa
    - keys/id_rsa.pub

- name: authorized ssh key for hadoop user