Hadoop_YARN

YARN概览

HDFS在两个版本中都存在；
MapReduce是Hadoop v1中唯一的Execution Engine；
YARN框架提供的Work Scheduling与正在执行的Work类型无关；
Hadoop v2上的所有的Execution Engine都作为YARN应用程序实现。
Hadoop v2支持任何Execution Engine，包括MapReduce的端口，该端口现在是一个YARN应用程序。

为什么选择YARN

MapReduce是batch-based，不适合 real-time, near-real-time, Graph, Iterative数据处理；
Hadoop v1限制了运行其他框架，YARN使MapReduce以外的工作也能够在Hadoop集群上执行；
Hadoop v1 的JobTracker存在并发问题，一个Hadoop Cluster的限制在3000-4000个节点。
YARN的目标是能够扩展到10000个节点；
YARN允许在同一个集群中同时运行不同版本的MapReduce；

YARN是一个分布式调度器，负责以下两个活动：

响应Client申请Container的请求，Container实质上是一个process，能对指定的物理资源进行管理。
监视正在运行的Container，并在需要时终止Container。
- 释放Container以便其他Application的Container可以运行；
- Container使用的资源超出Allocated的资源。

YARN概念和组件

YARN组件及其相互作用

ResourceManager

调度器Schedule(YarnScheduler)：响应客户端创建Container的请求，Container的创建实际上委托给了NodeManager
应用程序管理器ApplicationManager(RMAppManager)： manages the list of applications。

NodeManager

接收ResourceManager指令创建、监视、终止Container
向ResourceManager报告Container状态

典型的YARN应用程序

ApplicationManager

向ResourceManager申请资源Container
监控Application状态，失败重启Application

单节点内的container

客户端指定每个Container的CPU和内存要求，再加上没有预定的进程分配，这意味着与MapReduce调度程序相比，YARN对节点的利用率的控制要好得多；
每个Container创建时都考虑到具体的CPU和内存占用（由ApplicationMaster指定）
一个NodeManager中有一个Container Pool，该Pool内可以启动多个不同大小的Container
Container进程可以是 Linux命令、Python应用程序、其他可由操作系统启动的任何进程；

YARN配置

与YARN交互

实验2：在YARN集群中运行一个命令

问题：您希望在 `Hadoop` 集群中的节点上运行 `Linux` 命令。

解决办法：使用与 Hadoop 捆绑在一起的`DistributedShell`示例应用程序。

作用：Start by issuing a Linux find command in a single container:

DistributedShell ApplicationMaster在分开的Container中启动find命令，您看不到该命令的执行结果，find命令的标准输出（和标准错误输出）将重定向到Container的日志输出目录。

[zhangsan@node1 userlogs]$ yarn org.apache.hadoop.yarn.applications.distributedshell.Client -debug -shell_command find -shell_args '`pwd`' --jar ${HADOOP_HOME}/share/hadoop/yarn/*distributedshell-*.jar -container_memory 250 -master_memory 250 -num_containers 5

如果成功执行该命令，您将会看到如下结果：

1	INFO distributedshell.Client: Application completed successfully

如何确定Application ID？

1
2
3

[zhangsan@node1 ~]$  yarn org.apache.hadoop.yarn.applications.distributedshell.Client -debug -shell_command find -shell_args '`pwd`' --jar ${HADOOP_HOME}/share/hadoop/yarn/*distributedshell-*.jar -container_memory 350 -master_memory 350 -num_containers 3
... ...
22/10/06 19:04:26 INFO impl.YarnClientImpl: Submitted application `application_1665053453700_0001`

使用CLI查看日志：

1 2	[zhangsan@node1 ~]$ yarn logs -applicationId application_1665053453700_0001 Application has not completed. Logs are only available after an application completes

应用程序完成后，如果尝试再次运行该命令，您可能会看到以下输出：

[zhangsan@node1 ~]$ yarn logs -applicationId application_1665053453700_0001
22/10/06 19:05:46 INFO client.RMProxy: Connecting to ResourceManager at node1/192.168.179.101:8032
/tmp/logs/zhangsan/logs/application_1665053453700_0001 does not exist.
Log aggregation has not completed or is not enabled.

YARN CLI仅在Application完成并启用了日志聚合时才能使用。

关闭 YARN Application

1 2	[zhangsan@node0 bin]$ yarn application -kill application_1670156642351_0002 22/12/05 01:17:47 INFO client.RMProxy: Connecting to ResourceManager at node0/192.168.179.100:8032

实验3：获取container日志

问题：

访问Container日志文件。

解决办法：

使用YARN的UI和命令行访问日志。

讨论：

Container输出（如日志文件）写入本地文件系统。
如果没有启用日志聚合，本地日志文件将保留yarn.nodemanager.log.retain-seconds秒；
如果启用了日志聚合yarn.log-aggregation-enable，在Application执行完成后，所有Container的日志都会被复制到HDFS中，然后清除slave节点的日志，除非设置了yarn.nodemanager.delete debug-delay-sec。

实验4：聚合container日志

启用日志聚合

<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>

通过UI访问聚合后的日志

<property>
    <name>yarn.log.server.url</name>
    <value>http://node1:19888/jobhistory/logs</value>
</property>

启用MR日志服务器

1	[zhangsan@node1 ~]$ mr-jobhistory-daemon.sh start historyserver

访问HDFS 中的日志文件

默认情况下，聚合的日志文件将存入HDFS中的以下目录

<property>
    <name>yarn.nodemanager.remote-app-log-dir</name>
    <value>/tmp/logs</value>
    <source>yarn-default.xml</source>
</property>
<property>
    <name>yarn.nodemanager.remote-app-log-dir-suffix</name>
    <value>logs</value>
    <source>yarn-default.xml</source>
</property>

即：

1	/tmp/logs/${user}/logs/<application-id>/

如果通过WebUI无法查看HDFS中的日志，进行如下配置：

<property>
    <name>hadoop.http.staticuser.user</name>
    <value>zhangsan</value>
    <source>core-site.xml</source>
</property>

本地文件系统和HDFS中的日志区别

每个Container在本地文件系统中生成两个日志文件：一个用于标准输出stdout，另一个用于标准错误输出stderr。

作为聚合过程的一部分，给定节点的所有文件将串联到特定于节点的日志中。例如，如果您有五个跨三个节点运行的Container，则最终会在 HDFS 中得到三个日志文件。

日志压缩

<property>
    <name>yarn.nodemanager.log-aggregation.compression-type</name>
    <value>gzip或lzo</value>
</property>

本地日志保留

关闭日志聚合后，本地主机上的Container日志文件将保留 yarn.nodemanager.log.retain-seconds秒，默认值为 10800（3 小时）。

当日志聚合打开时，将忽略 yarn.nodemanager.log.retain-seconds控制，而是在将本地Container日志文件复制到 HDFS 后立即将其删除。但是，如果您想将它们保留在本地，进行如下配置，则所有内容都不会丢失，这不仅适用于日志文件，还适用于与Container关联的所有其他元数据（如 JAR 文件）。

<property>
    <name>yarn.nodemanager.delete.debug-delay-sec</name>
    <value>600</value>
</property>

剖析 YARN MapReduce Application

YARN内存管理

NodeManager存在于Linux系统中，Container存在于NodeManager中；所以

NodeManager Memory < Linux Memory
Container Memory < NodeManager Memory

NodeManager内存管理

<!-- yarn nodemanager允许管理的物理内存大小 -->
<property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>-1</value>
    <description>Amount of physical memory, in MB, that can be allocated for containers. If set to -1 and yarn.nodemanager.resource.detect-hardware-capabilities is true, it is automatically calculated(in case of Windows and Linux). In other cases, the default is 8192MB.  NodeManager默认可管理8GB内存；如果value=-1 且 启用自动检测硬件能力 ，该值会自动计算</description>
</property>

<property>
    <name>yarn.nodemanager.resource.detect-hardware-capabilities</name>
    <value>true</value>
    <description>Enable auto-detection of node capabilities such as memory and CPU.启用自动检测节点能力(CPU,Mem), 使用此配置项时，需要 设置yarn.nodemanager.resource.memory-mb=-1 </description>
</property>

Container内存管理

<!--yarn单个Container允许分配的最大最小物理内存 -->
<property>
    <name>yarn.scheduler.minimum-allocation-mb</name>
    <value>512</value>
	<description>The minimum allocation for every container request at the RM in MBs. Memory requests lower than this will be set to the value of this property. Additionally, a node manager that is configured to have less memory than this value will be shut down by the resource manager.容器的最小内存，nodemanager可管理的内存不能低于此值</description>
</property>

<property>
    <name>yarn.scheduler.maximum-allocation-mb</name>
    <value>3072</value>
    <description>The maximum allocation for every container request at the RM in MBs. Memory requests higher than this will throw an InvalidResourceRequestException.容器的最大内存，对container的内存请求不能高于此值</description>
</property>

注意：上面是说的物理内存，不是虚拟内存！

内存不够

如提示：containerID=container_1645498549388_0001_02_000001] is running beyond virtual memory limits. Current usage: 100.0 MB of 1 GB physical memory used; 2.2 GB of 2.1 GB virtual memory used. Killing container.

<property>
    <name>yarn.nodemanager.pmem-check-enabled</name>
    <value>false</value>
    <description>Whether physical memory limits will be enforced for containers.</description>
    
<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
    <description>Whether virtual memory limits will be enforced for containers.</description>   
</property>

或

<property>
    <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>4</value>
    <description>Ratio between virtual memory to physical memory when setting memory limits for containers. Container allocations are expressed in terms of physical memory, and virtual memory usage is allowed to exceed this allocation by this ratio.当启用内存检查时，设置虚拟内存与物理内存的比值</description>
</property>

未验证。